Tech Blog

Information Technology / Machine Learning / Data Analysis / Big Data / System Integration

EclipseでMahout環境を構築する

目的

Mahoutは、Hadoop上で動くスケーラブルなオープンソース機械学習ライブラリである。今回は、Mahoutをソースコードレビューするために、Eclipseに取り込む。実行環境ではないので悪しからず。OSはWindowsを使用している。

方法

1.以下のサイトにアクセスする。

2.必要そうなものをダウンロードする。mahout/やhadoop/からダウンロードできる。例えば以下のjarファイルをC:\Program Files (x86)\pleiades\3_7_Indigo\libに保存する。

mahout-core-0.7-cdh4.1.2.jar
mahout-core-0.7-cdh4.1.2-sources.jar
mahout-math-0.7-cdh4.1.2.jar
mahout-math-0.7-cdh4.1.2-sources.jar
mahout-examples-0.7-cdh4.1.2.jar
mahout-examples-0.7-cdh4.1.2-sources.jar
hadoop-core-2.0.0-mr1-cdh4.1.2.jar
hadoop-core-2.0.0-mr1-cdh4.1.2-sources.jar
hadoop-example-2.0.0-mr1-cdh4.1.2.jar
hadoop-example-2.0.0-mr1-cdh4.1.2-sources.jar

3.Eclipseを起動させる。

4.ファイル > 新規 > Javaプロジェクト > プロジェクト名を記入して次へ > ライブラリータブをクリック > 外部JARの追加 > ダウンロードしたjarファイルをすべて選択して開く。

5.各jarの左をクリック > ソース添付をダブルクリック > 外部ファイル > ソースファイルを開く。設定後の画面は以下のとおり。
f:id:tkdmah:20130515234133p:plain

6.これにて環境構築完了。例えば、mahout-exampleにはkddcup 2011を解くプログラムらしきものが含まれていますね・・・。
f:id:tkdmah:20130515235142p:plain