Hue 3.8のノートブックは凄い

hue

Hue 3.8で搭載されたノートブック。
http://gethue.com/new-notebook-application-for-spark-sql-2/?lang=ja
ようやく手元の環境で動かしてみました。ImpalaもHiveもSparkも使える。
結論から言うと、これはいい!!
インタフェースは今後も洗練していくと思うけど、今までのHueのようにアプリを切り替えることなく、一つのノートブックからImpala、HiveのクエリやSparkのREPL、その他を対話的に実行でき、必要に応じてグラフに切り替えて可視化して表示できる。
Cloudera Search (Apache Solr)用の検索アプリもかなり洗練されています。

http://gethue.com/more-solr-search-dashboards-possibilities-2/?lang=ja
しかも、これらの分析基盤を構築するのも、Cloudera Managerからのセットアップなら超簡単。
残念なのは、CDH5.4に同梱されているHueはこの機能が無効になっているので、自分でビルドしないといけないってところかな。ビルドはそんなに難しくないので、興味がある方は以前のブログも参考にしてください。

ではお約束のスクリーンショットを。

SparkとHiveでのクエリの結果


上から順番に、Hive、pyspark、Hive。(スクリーンショットが少しおかしい?あと、最後のクエリはImpalaにした方がが良かったかも)

同、グラフ表示に切り替え

同、地図表示に切り替え


なぜ海の上に...?w
備忘録
[code]
./build/env/bin/hue runserver
./build/env/bin/hue livy_server
[/code]

コメント