続)Cloudera Impala 情報 (10)

Impala情報 2012/12/14版

ロードマップ登場

Cloudera Blog -
    Clouderaから日本語訳が出ると思うので、ここでは概要のみ。リリースは2013Q1とのことなので、3月ぐらいでしょうか?

    GAでの対応予定
  • ファイルフォーマット:AvroとTextFileのLZO圧縮フォーマット対応
  • 対応OSの拡大:RHEL5/CentOS5をサポートする意味は大きいのでは? RHEL/CentOS 5.7, Ubuntu, Debian, SLES, and Oracle Linux
  • 速いマシンと遅いマシンが混在した環境でもうまく動くように
  • JDBCドライバ対応
  • DDL対応。CREATE TABLEができるようになる
  • 高速で、大規模に、よりメモリを効率よく使うJOIN:partitioned hash join
  • 高速で、大規模に、よりメモリを効率よく使うAggregation:enables pre-aggregation
  • SQLパフォーマンスの最適化:さらに低レイテンシに
  • 自動メタデータリフレッシュ:refreshコマンドをたたかなくても良い(重要w)
  • Trevni対応(あれ?RCFileの話題がない...)
  • GA後の対応予定
  • UDFに対応
  • Cost-based join order optimization
  • External joins using disk(大規模なJoinのため)
  • Nested data

ニュース

雑記

アップデートが遅れましたが、記事が少ないのではなく業務が忙しいのです。。。
で、Hadoopユーザー会の講演にImpalaで応募してみました!採択されると忙しくなるという悪循環なのですが。