Hue 3.8のノートブックは凄い

Hue 3.8で搭載されたノートブック。
http://gethue.com/new-notebook-application-for-spark-sql-2/?lang=ja
ようやく手元の環境で動かしてみました。ImpalaもHiveもSparkも使える。
結論から言うと、これはいい!!
インタフェースは今後も洗練していくと思うけど、今までのHueのようにアプリを切り替えることなく、一つのノートブックからImpala、HiveのクエリやSparkのREPL、その他を対話的に実行でき、必要に応じてグラフに切り替えて可視化して表示できる。
Cloudera Search (Apache Solr)用の検索アプリもかなり洗練されています。
search-only
http://gethue.com/more-solr-search-dashboards-possibilities-2/?lang=ja
しかも、これらの分析基盤を構築するのも、Cloudera Managerからのセットアップなら超簡単。
残念なのは、CDH5.4に同梱されているHueはこの機能が無効になっているので、自分でビルドしないといけないってところかな。ビルドはそんなに難しくないので、興味がある方は以前のブログも参考にしてください。
 
ではお約束のスクリーンショットを。

SparkとHiveでのクエリの結果

Hue Notebook1上から順番に、Hive、pyspark、Hive。(スクリーンショットが少しおかしい?あと、最後のクエリはImpalaにした方がが良かったかも)

同、グラフ表示に切り替え

 
Hue Notebook2

同、地図表示に切り替え

Hue Notebook3なぜ海の上に…?w
備忘録
[code]
./build/env/bin/hue runserver
./build/env/bin/hue livy_server
[/code]
 

コメント