(備忘録)Hadoop、CDH、Cloudera Manager、Sparkの便利リンク

最近見つけた便利なリンク

Cloudera Quickstart VMを5.7にアップデート(1)

先日 Cloudera Enteprise 5.7 がリリースされました!リリースアナウンスによると、

  • Hive on Sparkのサポート!
    • Hiveによるバッチ処理をSparkでも実行できるようになりました。
  • Impala 2.5は前のバージョンと比較して2倍高速に。これはかなり凄い
  • HBaseが1.2にリベース
  • Cloudera Manager 5.7。さらに使いやすく
  • セキュリティ強化
  • 品質向上、、、

など、今回のリリースはかなり気合が入っているようです。

いつものように最新バージョンを手軽に触ってみたいところですが、残念ながら現時点ではCloudera Quickstart VMの5.7対応版はリリースされていません。今回はダウンロードできる5.5から5.7にアップグレードしてみました。

(続きを読む)

2014年版 Hadoopを10分で試す(1)

Hadoop関連(全部俺) Advent Calendar 2014:7日目

先週の研修中に、「Hadoopをこれから試してみたいけど、どこから始めたらいいでしょうか?」という質問がありました。

構築の勉強をしたいのであれば、今ならパブリッククラウドや仮想化環境を使えるので、実際に構築してみるのが良いでしょう。パッケージを手作業でインストールしても良いですし、Cloudera Managerを使えば簡単です。 (続きを読む)

「Hadoopを40分で理解する」のスライド公開!

(2014/12/10追記)Hadoop入門になりそうなブログをまとめたページを作成しました。-> Hadoopを10分で試す

Cloudera World 2013の資料が公開されました

先週開催されたCloudera World Tokyo 2013、資料が公開され始めました。
http://www.cloudera.co.jp/cwt2013-session.html

まだ全てのスライドは揃っていませんが、順次公開されるとのこと。
Hadoopを40分で理解する」のスライド(pdf)もダウンロードできるようになっています。

スライドシェアにも上げてあります。

#cwt2013