impala

impala impala
impala

Impala 4 でサポートされる予定のROLLUP、CUBE、GROUPING SETS

ついに(というかようやくというか)、Impala でも SQL2003 のCUBE, ROLLUP, GROUPING SETS 関数が利用できるようになるようです。 Hive、Presto、Spark SQL等のSQL on Had...
hive

Impala, Hive, Presto, Spark のJOINに関するメモ

SQL on Hadoop でのJOIN時のテーブルの指定順序と挙動 結合の種類にもよりますが、複数のテーブルを結合する際、一つのテーブルを全てのワーカーノードに転送して行う場合があります。(Broadcast JOIN) もちろん、統計情...
Docker

HueからImpala+Kuduへの接続を全てDockerで行う

Kudu-ImpalaのDockerイメージを使うと、KuduやImpalaのインストールは不要で、ImpalaからSQLを用いてKuduにクエリを行うことができます。 ImpalaもKuduも、本来は数十〜数百ノードに分散してスケールアウ...
impala

Apache Impala 3.4 リリース!

前回のリリースからだいぶ時間がかかった気がしますが、Impala 3.4 がリリースされました。 "To Impala 4 and beyond!" とあるので今後は Impala 4 に向けての開発が進んで行きそうですが、ver 3....
impala

Apache ImpalaからKuduのQuickstart環境を使う(10分で試すシリーズ)

Apache Impala via Kudu Quickstart Environment 以前、Kudu の Quickstart 環境のブログを書きましたが、その時は a) Apache NiFi でデータをKuduに書き込み、b) A...
impala

HuluでImpala

MPPのクエリエンジンであるApache Impalaは、CSVなどのテキストフォーマットも扱えますが、高速な処理を行う場合はParquetを使用することが多いです。(あるいはApache Kuduを利用することも可能) Hulu ...
impala

Impala 3.2 がリリースされました

本日 Apache Impala 3.2 がリリースされました。 新機能 今回は大きな機能追加はないようですが、テクニカルプレビューの Automatic Metadata Sync using Hive Met...
CDH5

Apache SparkでApache Kuduを利用する

Apache Kudu 1.3 最近Apache Kuduのリードとライトの流れについてのブログが公開され、昨日は日本語でもウェビナーが開催されたりと盛り上がってきた「分散ストレージエンジン」のApache Kuduですが、SQLでのアクセ...
impala

Impala Cookbookが2017年版に更新されています

Impalaを使う人なら必見の「The Impala Cookbook」(slideshare)が更新されています。要チェックや。
impala

ImpalaとKuduがApache Software財団に寄贈へ!

ついに素晴らしい2つのプロジェクト、ImpalaとKudoがApache Software Foundationに寄贈される方向で提案されました! Cloudera Proposes to Donate Impala and Kudu to...