EclipseでMahout環境を構築する
目的
Mahoutは、Hadoop上で動くスケーラブルなオープンソース機械学習ライブラリである。今回は、Mahoutをソースコードレビューするために、Eclipseに取り込む。実行環境ではないので悪しからず。OSはWindowsを使用している。
方法
1.以下のサイトにアクセスする。
2.必要そうなものをダウンロードする。mahout/やhadoop/からダウンロードできる。例えば以下のjarファイルをC:\Program Files (x86)\pleiades\3_7_Indigo\libに保存する。
mahout-core-0.7-cdh4.1.2.jar mahout-core-0.7-cdh4.1.2-sources.jar mahout-math-0.7-cdh4.1.2.jar mahout-math-0.7-cdh4.1.2-sources.jar mahout-examples-0.7-cdh4.1.2.jar mahout-examples-0.7-cdh4.1.2-sources.jar hadoop-core-2.0.0-mr1-cdh4.1.2.jar hadoop-core-2.0.0-mr1-cdh4.1.2-sources.jar hadoop-example-2.0.0-mr1-cdh4.1.2.jar hadoop-example-2.0.0-mr1-cdh4.1.2-sources.jar
3.Eclipseを起動させる。
4.ファイル > 新規 > Javaプロジェクト > プロジェクト名を記入して次へ > ライブラリータブをクリック > 外部JARの追加 > ダウンロードしたjarファイルをすべて選択して開く。
5.各jarの左をクリック > ソース添付をダブルクリック > 外部ファイル > ソースファイルを開く。設定後の画面は以下のとおり。
6.これにて環境構築完了。例えば、mahout-exampleにはkddcup 2011を解くプログラムらしきものが含まれていますね・・・。