Cloudera Impala インストール時の注意事項

Cloudera Impalaのインストール

Cloudera Impalaのインストールは

  1. マニュアル
  2. Cloudera Manager経由

のいずれかで行うことが可能です。
後者の方がImpalaをインストール/実行は簡単ですが、Cloudera Manager4.1をインストールしなければならないという制約があります。(とはいえ、50ノードまでは無償で利用可能です)
一番簡単なのは仮想マシンイメージ(KVM/VMWare/VirtualBoxの3種類が用意されている)でしょうね。
現状のImpalaは実行環境として、RHEL6.2/CentOS 6.2のLinux環境が必要です。
(未検証ですがRHEL6.3/CentOS6.3なら動作するかも?)
ImpalaはC++で開発されており、共有ライブラリの実行環境に依存します。他のLinuxディストリビューションをご利用の方は環境を用意する必要がありますね。
https://ccp.cloudera.com/display/IMPALA10BETADOC/Installing+Impala

Impala works with CDH that is installed on RHEL/CentOS 6.2. You cannot install Impala on RHEL/CentOS 6.2 and then use that installation to query information stored on CDH installations that are not on RHEL/CentOS 6.2 systems. This means that if you have CDH deployed on operating systems such as Debian/Ubuntu, SuSE, or RHEL/CentOS 5.7, you cannot use Impala with that installation.