(備忘録)Hadoop、CDH、Cloudera Manager、Sparkの便利リンク

最近見つけた便利なリンク

Apache Arrowとは

2月にApadheのトップレベルプロジェクトになったApache Arrowに注目しています。

一言で言えば「インメモリで列指向データを扱うための標準」を目指しているものです。

(続きを読む)

Cloudera Quickstart VMを5.7にアップデート(1)

先日 Cloudera Enteprise 5.7 がリリースされました!リリースアナウンスによると、

  • Hive on Sparkのサポート!
    • Hiveによるバッチ処理をSparkでも実行できるようになりました。
  • Impala 2.5は前のバージョンと比較して2倍高速に。これはかなり凄い
  • HBaseが1.2にリベース
  • Cloudera Manager 5.7。さらに使いやすく
  • セキュリティ強化
  • 品質向上、、、

など、今回のリリースはかなり気合が入っているようです。

いつものように最新バージョンを手軽に触ってみたいところですが、残念ながら現時点ではCloudera Quickstart VMの5.7対応版はリリースされていません。今回はダウンロードできる5.5から5.7にアップグレードしてみました。

(続きを読む)