Hive本のOozie

縁あってHive本 (Programming Hive)をレビューさせていただいています。日本語版が楽しみです。

動作検証をかなり時間をかけていたのですが、動かないクエリが多く、かなり苦戦しました。
O’Reillyのエラータにも報告しました(全部は多すぎるので一部だけ)が、一番難航したのがChapter20のOozie。
動かすまでにかなり手こずったので、フォークして修正したgitのレポジトリと、必要な手順をまとめてgithubに上げました。

Oozieを動かそうと思う方は少ないかもしれませんが、ご参考になれば。
修正版ソース:https://github.com/kawamon/m6d_oozie
ワークアラウンド:https://github.com/kawamon/hive_book/tree/master/ch20

Cloudera Impala 1.0 がリリースされました

Impala 1.0 Released

当初の予定より若干遅くなりましたが、Imapalaがリリースされました!
ImapalaはHiveと比較して低レイテンシで実行できるのが特徴です。試行錯誤しながらデータを「弄る」インタラクティブなクエリにより適しています。

いち早く @sudabon さんがベンチマークを公開して下さっています。
http://www.slideshare.net/sudabon/performance-evaluation-of-cloudera-impala-ga

ニュースサイト(時間がないので目に止まったところだけ)