Tech Blog

Information Technology / Machine Learning / Data Analysis / Big Data / System Integration

RMeCabでつまづくの巻

急にRMeCabのdocMatrix()が使えなくなった。
テキストの中身が空で読み込めないと言っているようだが…

文字コードをいろいろ変えて実行してみたけど変わらず。
そもそも以前は同じスクリプト・同じデータでちゃんと動いていたはずなので、明らかにおかしい。

さらにRとRMeCabを再インストールしたけど、やはり使えず。
現在鋭意原因究明中ナリ…

> library(RMeCab)
> a <- docMatrix("C:/LyricsWorkspace/Lyrics/Mr.Children_single", weight = "tf*idf")
file = C:/LyricsWorkspace/Lyrics/Mr.Children_single/[Mr.Children]【es】~Theme of es~.txt
empty results
…
file = C:/LyricsWorkspace/Lyrics/Mr.Children_single/[Mr.Children]箒星.txt
empty results
 以下にエラー terms.formula(formula, data = data) : 
   '.' が式中にありますが, 'data' 引数がありません 


(以下追記)
何日か悩み、MeCabを再インストールしたところ、治りました。
原因はMeCabとRMeCabのバージョンの整合性の問題のようでした。
そういえばPythonMeCabを連携させるためにMeCabのバージョンを変えたような気が…w

というわけで、また研究続行できそうです。(めでたしめでたし)