Tech Blog

Information Technology / Machine Learning / Data Analysis / Big Data / System Integration

Mr.Childrenの歌詞分析(3): シングル曲のクラスタリング

主結果

Mr.Childrenのシングル曲の歌詞をクラスタリングしてみると、このようになりました。(アルバム曲を含めてクラスタリングすると図が煩雑になってしまうため、今回はシングル曲のみで実行しました。)

f:id:tkdmah:20130102231629j:plain

 

妥当性の検証

この結果って、どうなんでしょう。クラスタリングの妥当性はどの程度あるのでしょうか。近いと判断されたクラスタごとに、楽曲の歌詞を少し調べてみました。

【街】クラスタ

曲名歌詞
innocent world 黄昏のを背に 抱き合えたあの頃が 胸をかすめる
旅立ちの唄 君の大好きだった歌 に流れる

【優しい】クラスタ

曲名歌詞
口笛 優しく響く あの口笛のように
優しい歌 優しい歌 忘れていた 誰かの為に 小さな火をくべるよな

【現実】クラスタ

曲名歌詞
マシンガンをぶっ放せ この現実に目を向けなさい
hypnosis もう現実から見捨てられても 構わないさ

【明日】クラスタ

曲名歌詞
フェイク 虚しさを抱えて 夢をぶら下げ 二階建ての明日へとTAKE OFF
Tomorrow never knows 心のまま僕はゆくのさ 誰も知ることのない明日

【二人】クラスタ

曲名歌詞
Replay 二人で駆け抜けた季節も どんな場面も 振り返れば ほら 微笑み溢れてる
抱きしめたい 二人だけの 夢を胸に 歩いてゆこう
 
こう見ると、各クラスタは特徴的なキーワードを共有していることが分かります。ただ、現状ではキーワードの意味合いやその状況が解析できていないため、人間がこれらの歌詞を読んだときの感情とは少し離れているようです。
 

手法

本稿は、 前回書いた記事(tf-idf法とウォード法による手法) に基づいて解析しています。