Cloudera 5.3.0 リリース!

Hadoop関連(全部俺) Advent Calendar 2014: 23日目の記事です
Cloudera Managerのトップメニューには「新しいParcel」というアイコンがあり、アップデートされたパッケージがある場合にはパッケージの件数を表示します。

Cloudera 5.3.0

このアイコンで気づきましたが、CDH5.3.0とCloudera Manager 5.3.0 が公開されていますね。一足早いクリスマスプレゼントですね(笑
ドキュメントも最新版が用意されています。

CDH5.3.0、Cloudera Managerのドキュメント

http://www.cloudera.com/content/cloudera/en/documentation.html
リリースノートの中で個人的に興味深いものをピックアップしてみました。Hadoopのバージョンは2.5.0ベースなので、リベースはありません。まぁ、Hadoop 2.6.0がリリースして間もないですし、、、とはいえ Spark は 1.2.0 にリベース。こちらは Spark StreamingをPythonで書けるようになったので、個人的には嬉しいです。

CDH5.3.0

Cloudera Manager 5.3.0

  • Oracle JDK 1.8 サポート
  • シングルユーザーモード
  • アップグレードウィザードの改善
  • 暗号化 HDFS Data At Rest Encryption

Quickstart VM を5.3.0環境に

さすがに(現時点では)5.3.0のQuickstart VMは更新されていなかったので、手元のQuickstart VMをCDH5.3.0にアップデートしてみました。
参考:Cloudera Quickstart VMのダウンロードページ

Parcelをダウンロード

Cloudera Managerのホストメニュー(または新しいParcelをクリックして)Parcelのページに移動します。CDH5.3.0のParcelパッケージのダウンロードボタンを押してParcelをダウンロードします。
cdh5.3.1.parcel

CDH5.3.0のParcelを配布

CDH5.3.0の配布ボタンを押して、ダウンロードしたParcelを各ノード(と言っても1ノードですが、、)に配布します。
cdh5.3.1_distribute

アクティブ化

CDH5.3.0のアクションボタンを押してアクティブにします。この時点では、クラスタの各ノード(と言っても1ノード(略))ではCDH5.2.1がまだ使用されていますね。クラスタを再起動して CDH5.3.0 で立ち上げ直しましょう。
cdh5.3.1.activate

CDH5.3.0!

いくつか警告が出ていますが、無事にCDH5.3.0に更新されました。ホストインスペクタでも確認してみましょう。
cdh5.3.0

ホストインスペクタ

cdh5.3.0_host_inspector

バージョンのサマリ

めでたく CDH5.3.0 (Hadoop 2.5.0)になってますね。
host_inspecto_version_sammaryあ、Cloudera Managerを更新するのを忘れてましたが、続きは明日にします。

コメント

  1. kernel023 kawasaki より:

    そうそう、Impala 2.1もリリースされています。(リリースノートが分かれているのでわかりにくい)
    http://www.cloudera.com/content/cloudera/en/documentation/core/latest/topics/impala_new_features.html#new_features_210_unique_1