プロジェクト: あかんわ…

0になるというのは、一つの文毎に再計算してたのが間違いらしい。各文毎に計算したものを足し合わせて、最後に再計算という手順のようなのでそれで実装。
これでなんとかいけるかな、とか思ってたが、遂に最初にぶつかった問題に戻ってきた。単語出力確率をどうやって覚えるか。学習データに出現する単語の種類は約2.2万。品詞数は47。iからjに行くときにoを出力する確率だから、47*47*22000で大体50Mくらい…。doubleだと400MBか?hash-tableで実装してもuvectorで実装してもこれはちょっと無理やろ。一応試してみたが、初期化の時点でメモリを食い尽くして固まる。どうしたものか…。