Hadoopを10分で試す(3)HueからHiveとImpalaのクエリを実行する

**この記事の内容は若干古くなっています。まとめページもご覧下さい**

前回のブログでCloudera Managerを日本語化しましたが、同時にHue (http://gethue.com) というHadoopのGUIツールも日本語化されています。

Hueはオープンソースで提供されている、Hadoop用のGUIツールです。GUIからHive、Pig、Impala、HDFS、MapReduce、Oozie、、などの機能を使用することができる、エンジニア以外の方にも使い易いツールです。(ロゴが可愛いw)
Hue logo

今回はHueのいくつかの機能についてはスクリーンショットを、続いてHueからHiveとImpalaを使ったサンプルクエリを実行してみます。
(全ての画像はクリックすると拡大します)

HDFSへのアクセス

HDFSへのアクセスはブラウザから行うことができます。

ファイル一覧(ここから削除やリネームも出来る)
Hue HDFS1

ファイルの内容を表示
Hue HDFS2

MapReduce ジョブの表示

Hue MapReduce1

Hue MapReducd2

Hive (beeswax)

さて、Hiveです。HueにはHive用のサンプルのテーブルを作る機能があります。今回はこのテーブルをセットアップして、クエリを実行してみましょう。

テーブルのセットアップ
Hue Hive sample

サンプルのインストール
Hue Hive sample install

インストールされたHiveのサンプルテーブル
Hive sample tables

テーブルの構造も見ることができます(一覧も表示できる)
hue sample table 08

クエリを作成してみます。なおクエリは保存可能です。(このクエリはHueのドキュメントから引用)
Hue Hive Query Editor

クエリを実行します。MapReduceのジョブが走っているようです。
Hue Hive Query Running

クエリの結果はこのようになりました。
Hue Hive Query Result

(※)なお、このクエリは手元の環境では三分半ほどかかりました。

Impala

Cloudera Impalaは、Hiveのメタ情報を利用しています。既にHiveのテーブルをセットアップしているので、ここでは先ほどのhiveと同じクエリをImpalaで実行してみましょう。

クエリエディタです。Hiveと同じですね。
Hue Impala Query Editor

クエリを実行してみました。一瞬で結果が戻ってきました。早い!
Hue Impala Result

このように、HueはHadoopを使い易くするためのツールです。最新版ではPigやCloudera Searchなどを利用できるようになっています。ぜひ一度触ってみて下さい。
今回はHueがセットアップされていましたが、次回はHueのインストール方法を少し紹介します。

Pocket