HueでHadoopをWeb UIから使う
Hue とは
Hadoopは基本的にコマンドラインやJavaから操作する。そのため、初心者にはハードルが少々高い。
実は、オープンソースのWeb UIがApacheで開発されている。Web UIを用いることで、操作が単純になり、学習コストも低減される。
今回は、そのHueをインストールして使ってみる。
- Hueの公式ホームページ: http://cloudera.github.io/hue/
- HueのGitHubページ: https://github.com/cloudera/hue
Hueのインストール
0. Hadoop環境を構築する。
カンタンにHadoop環境を試用するには、Cloudera社が提供しているVMイメージを用いるよい。ClouderaのダウンロードページからVMをダウンロードし、VMWare Playerで立ち上げれば、すでにHadoop環境が整っている。詳細は下記のエントリを参照のこと。
今回の環境
- CentOS 6.2 64bit
- Hadoop 2.0.0-cdh4.1.1
1. Gitをインストールする。
HueはGithubで公開するため、Gitをインストールしておく必要がある。
$ yum -y install git-core
3. Mavenをインストールする。
下記からMevenをダウンロードする。
ダウンロードしたファイルを解凍し、パスを通しておく。
$ mkdir /usr/local/apache-maven $ mv /tmp/apache-maven-3.0.5-bin.tar.gz /usr/local/apache-maven/ $ cd /usr/local/apache-maven $ tar zxvf /usr/local/apache-maven/apache-maven-3.0.5-bin.tar.gz $ export M2_HOME=/usr/local/apache-maven/apache-maven-3.0.5 $ export M2=$M2_HOME/bin $ export PATH=$M2:$PATH $ mvn --version
4. その他必要なツールをインストールする。
$ yum -y install ant $ yum -y install asciidoc $ yum -y install cyrus-sasl-devel $ yum -y install cyrus-sasl-gssapi $ yum -y install gcc $ yum -y install gcc-c++ $ yum -y install krb5-devel $ yum -y install libtidy $ yum -y install libxml2-devel $ yum -y install libxslt-devel $ yum -y install mysql $ yum -y install mysql-devel $ yum -y install openldap-devel $ yum -y install python-devel $ yum -y install python-simplejson $ yum -y install sqlite-devel
5. Hueをインストールする。
$ cd /usr/lib/hue $ make apps $ build/env/bin/hue runserver
Hueを使ってみる
ホームページ
Hive
ファイルブラウザ
Hueってあまり聞かないけど、なかなか便利そうだ。(インストールはとても面倒だが。)
(以下追記)
今回はApache Hueをインストールしましたが、CDHであれば
$ yum install hue hue-server $ yum install hue-plugins
のようにyumでインストールできるようです。なるほど便利ですね^^情報ありがとうございます。