Tech Blog

Information Technology / Machine Learning / Data Analysis / Big Data / System Integration

2012-12-30から1日間の記事一覧

MeCabで複数のテキストファイルの形態素解析を行う

MeCabとは 日本語の文章を分析するとき、まず行うのが「形態素解析」である。形態素解析では、日本語を単語に分割して、それぞれの品詞や読みの解析を行う。これは非常に難しい問題だが、ありがたいことに、 MeCab というオープンソース形態素解析エンジンが…

歌詞をテキスト形式でダウンロードする

あるアーティストの歌詞をテキスト形式で一括ダウンロードできないかと探していたら、 Lyrics Master というソフトを発見。これは便利!アーティストの歌詞をすべてダウンロードするには、アーティスト名で検索し、右クリック>すべてダウンロードを選択すれ…