impala Impala 4 でサポートされる予定のROLLUP、CUBE、GROUPING SETS ついに(というかようやくというか)、Impala でも SQL2003 のCUBE, ROLLUP, GROUPING SETS 関数が利用できるようになるようです。 Hive、Presto、Spark SQL等のSQL on Had... 2020.08.05 impala
hive Impala, Hive, Presto, Spark のJOINに関するメモ SQL on Hadoop でのJOIN時のテーブルの指定順序と挙動 結合の種類にもよりますが、複数のテーブルを結合する際、一つのテーブルを全てのワーカーノードに転送して行う場合があります。(Broadcast JOIN) もちろん、統計情... 2020.07.29 hiveimpalaprestoSpark
Docker HueからImpala+Kuduへの接続を全てDockerで行う Kudu-ImpalaのDockerイメージを使うと、KuduやImpalaのインストールは不要で、ImpalaからSQLを用いてKuduにクエリを行うことができます。 ImpalaもKuduも、本来は数十〜数百ノードに分散してスケールアウ... 2020.05.07 DockerhueimpalaKudu
impala Apache Impala 3.4 リリース! 前回のリリースからだいぶ時間がかかった気がしますが、Impala 3.4 がリリースされました。 "To Impala 4 and beyond!" とあるので今後は Impala 4 に向けての開発が進んで行きそうですが、ver 3.... 2020.05.01 impala
impala Apache ImpalaからKuduのQuickstart環境を使う(10分で試すシリーズ) Apache Impala via Kudu Quickstart Environment 以前、Kudu の Quickstart 環境のブログを書きましたが、その時は a) Apache NiFi でデータをKuduに書き込み、b) A... 2020.04.05 impalaKudu
impala HuluでImpala MPPのクエリエンジンであるApache Impalaは、CSVなどのテキストフォーマットも扱えますが、高速な処理を行う場合はParquetを使用することが多いです。(あるいはApache Kuduを利用することも可能) Hulu ... 2019.06.03 impala
impala Impala 3.2 がリリースされました 本日 Apache Impala 3.2 がリリースされました。 新機能 今回は大きな機能追加はないようですが、テクニカルプレビューの Automatic Metadata Sync using Hive Met... 2019.03.29 impala
CDH5 Apache SparkでApache Kuduを利用する Apache Kudu 1.3 最近Apache Kuduのリードとライトの流れについてのブログが公開され、昨日は日本語でもウェビナーが開催されたりと盛り上がってきた「分散ストレージエンジン」のApache Kuduですが、SQLでのアクセ... 2017.04.28 CDH5impalaSpark
impala Impala Cookbookが2017年版に更新されています Impalaを使う人なら必見の「The Impala Cookbook」(slideshare)が更新されています。要チェックや。 2017.02.10 impala
impala ImpalaとKuduがApache Software財団に寄贈へ! ついに素晴らしい2つのプロジェクト、ImpalaとKudoがApache Software Foundationに寄贈される方向で提案されました! Cloudera Proposes to Donate Impala and Kudu to... 2015.11.18 impalaKudu