CDH release history (Japanese | 日本語 )

Hadoop関連(全部俺) Advent Calendar 2014: 25日目の記事です
elephant
カレンダー最終日&CDH5.3.0がリリースされたのを記念に、CDHのリリース履歴を1枚の図にまとめてみました。(かなり文字が小さいので、ダウンロードしてご覧になることをお勧めします。なお、画像はクリックで拡大します)

CDHのみのリリース履歴

(PDF | PNG)
cdh_only

CDH (+Hadoop+Ecosystem)のリリース履歴

(PDF | PNG)
cdh_and_ecosystem
 

図から見えてくる事実

  • CDHのメジャーリリースとマイナーリリースは、概ね一定期間ごとに行われている
    • エンタープライズ用途ですしね
  • Hadoopに関しては、ほとんどリベースしていない
    • 枯れてきている&バックポートしている
  • Impala、Hue、Sparkのリリース頻度は激しい
    • 機能追加、パフォーマンスの改善などが激しいためでしょう
  • CDH4のEOM (End of Maintenance) => 2015/6/4
    • 来年ですよ。アップデートの準備はお早めに!

総括

エンタープライズでHadoopが利用されるようになって数年、利用範囲はますます拡大しています。図を見てわかるように、Hadoop自身の進化も着実に進んでいることがわかりますが、それにも増してエコシステムの充実ぶりは著しいものがあります。
その一方で、Red Hat Enterprise Linux(RHEL)のようなディストリビューションと比較して、Hadoopのサポート期間は短すぎると言う声も耳にします。しかしHadoopとLinuxが公開された時期、エンタープライズで利用されるようになった時期を考えても、まだその域に達していなかったということでしょうね。Hadoopは日々進化していますし、LinuxのRHELとFedoraの関係のように、今後はエンタープライズで利用する安定版と、新規機能を追い求める安定性を重視しない版のようなものに分かれていくのかもしれません。
また、以前に比べてHueやCloudera Managerのようなツールが登場し、Hadoopは相当使いやすくなっています。数年前にHadoopを触ってそれっきりという方は、新しいHadoopがどう変わっているのか是非遊んでみてください。(何回もブログに書いてますが、quickstart vmはオススメです!)
2014年のアドベントカレンダー初日にも書きましたが、今後のHadoopは、安定性やセキュリティという堅調な進化と平行して、エコシステムを中心に大きく変わっていく可能性があります。混沌の中で、来年はHadoopにどんな変化があるのでしょうか?楽しみです。
#しかし、さすがに毎日書くのはしんどいので、来年のカレンダーは無理かな、、、、

コメント