musashiを使ってテキストマイニング


どうも話を聞いてると、今のやり方よりも決定木を用いる方法のほうが良いらしい。いろいろ勘案してアルゴリズムを変更することに。次のリリースで。


よくよく考えると決定木を作るには教師信号が必要で、今の場合には使えないはず。なんか聞き間違えたかな。(-_-;



アソシエーション・ルールだった。(-_-; musashiを1.0.3にバージョンアップすればあるらしい。



今のところ、直交変換、相関、主成分分析なんかの単純な世界の類推で考えてるからか、こんなにいろんな手法を使いわけなきゃいけない理由がよくわかってない。(-_-; 使えるデータが同じであれば(得られてる情報量としては同じで)使う手法を変えても似たような結果が出てくるような気はするんだけど。なんか奥が深そう。


追記1:

  • 計算時間は違うかもしれない>これは重要。


追記2:

  • 例えば因果関係が重要な場合「直交変換、相関、主成分分析なんかの単純な世界」では正しく扱えない>こっちのほうが重要だ。(^^;