Impala情報 2012/12/14版
ロードマップ登場
Cloudera Blog -
-
Clouderaから日本語訳が出ると思うので、ここでは概要のみ。リリースは2013Q1とのことなので、3月ぐらいでしょうか?
- ファイルフォーマット:AvroとTextFileのLZO圧縮フォーマット対応
- 対応OSの拡大:RHEL5/CentOS5をサポートする意味は大きいのでは? RHEL/CentOS 5.7, Ubuntu, Debian, SLES, and Oracle Linux
- 速いマシンと遅いマシンが混在した環境でもうまく動くように
- JDBCドライバ対応
- DDL対応。CREATE TABLEができるようになる
- 高速で、大規模に、よりメモリを効率よく使うJOIN:partitioned hash join
- 高速で、大規模に、よりメモリを効率よく使うAggregation:enables pre-aggregation
- SQLパフォーマンスの最適化:さらに低レイテンシに
- 自動メタデータリフレッシュ:refreshコマンドをたたかなくても良い(重要w)
- Trevni対応(あれ?RCFileの話題がない...)
- UDFに対応
- Cost-based join order optimization
- External joins using disk(大規模なJoinのため)
- Nested data
GAでの対応予定
GA後の対応予定
ニュース
- Hadoop用リアルタイムクエリエンジン Impalaのポテンシャルをレビューした
- Performance evaluation of cloudera impala 20121208
- Cloudera CEO: We're taking Hadoop beyond MapReduce
登録しなければ見られないのはなんとかしてほしい
Impalaの概要、HiveとImpalaでのベンチマーク比較など詳細に説明されている。一見の価値あり。
上記@ITの元ネタ。@sudabonさん。こちらの方が新しい情報が掲載されている。ver0.3はver0.2よりもさらに改善されていることがわかりますね。
雑記
アップデートが遅れましたが、記事が少ないのではなく業務が忙しいのです。。。
で、Hadoopユーザー会の講演にImpalaで応募してみました!採択されると忙しくなるという悪循環なのですが。