このブログは「Distributed computing (Apache Spark, Hadoop, Kafka, ...) Advent Calendar 2019」の23日目の記事です。
2019年末時点での最新バージョンはHue 4.6です。Hueのプロジェクトページには、昨年まで「Query. Explore. Repeat.」と記載されていたキャッチコピーが、今年は「Query. Explore. Share.」と変更されています。今後のバージョンでは共有がキーワードになるかもしれません。
今年は新機能目白押し、というよりも、エコシステムとの連携が強化された印象です。
・Docker/Kuberntes対応
Dockerを使って最新のHueを簡単に試すことができるようになりました。Dockerイメージの作成も簡単に行えます。
SQLエンジンの対応
Druid、Hive on Tez、Hive LLAP等への対応が進んでいます。
Hueでは従来からHive、Impalaは利用できましたが、今年リリースされたHueでは Hive on Tezクエリ中にログを表示したり、実行中のクエリの進捗が表示できるようになってきています。また、右のペインでHiveのドキュメントも参照できるようになりました。
- Druid
Quick Task: How to query Apache Druid analytic database - Hive on Tez
Hive on Tez integrations improvements - Phoenix
SQL querying Apache HBase with Apache Phoenix
Impalaのクエリ実行計画の表示
また、データ分析にApache Impalaを使用している方向けに便利な機能が加わりました。
元々Impalaのワーカーノード(Impalad)では、WebUI上からクエリの実行計画やプロファイルなどが表示できます。昨年のブログにも書いた通り、Hueのジョブブラウザーから実行計画が表示できるようになっていましたが、今年はクエリのプロファイルがさらに細かく可視化できるようになりました。クエリのチューニングなどには役立ちますね。

gethue blog より引用
詳細は下記のブログ記事をご覧ください。
Hue 4.4 and its improvements are out!
テーブルの主キー、外部キー、複雑なデータ型の表示
主キーや外部キーの表示、複雑なデータ型のオートコンプリートの対応など、一層使いやすくなりました。
Visually surfacing SQL information like Primary Keys, Foreign Keys, Views and Complex Types
その他
- Apache Atlasとの統合
Realtime catalog search with Hue and Apache Atlas
- Azue ADLS gen2 対応
Integration with Microsoft Azure Data Lake Store Gen2

ADLS gen2 の表示: gethue.comより引用
- デザインの変更
左側のメニューが見やすくなりました。
このデザインは、Cloudera Manager 7のデザインに合わせて変更されたようです。
まとめ
現在Python3への対応が進んでいます。2020年もデータのセルフサービスツールとして、今後ますます使いやすくなることを期待しています。
なお例年通り、手っ取り早く試してみるには Hue のデモサイト (https://demo.gethue.com) がオススメです。(ユーザー名とパスワードは demo)
コメント