Hadoop入門

Hadoopを使ってみよう!

これからHadoopに関わろうと思っている方のためのまとめ情報です。
最新情報はこのページに反映されていない場合もありますので、ブログ記事も探してみてください。

Hadoop関連書籍の発売予定

オライリーを含むHadoop関連書籍の発売予定をまとめています。
CDH (Cloudera’s Distribution Including Apache Hadoop)は、Cloudera社のHadoopディストリビューションです。エンタープライズ環境で最も広く使われています。

Hadoopの理解に関する役立つリンク (New)

Hadoopを40分で理解する

イベントで喋ったときの資料です。Hadoopとはどんなものか、大雑把にイメージが掴めるんじゃないかと思います。初心者向けです。ちょっと古い。(詳細はこちら

Hadoopを10分で試す

Hadoopを10分で試す、というタイトルで書いていたブログの総集編です。

Hadoopを使ってみたい!

新しく何かを始めようと思った時、面倒だなぁと思うことは多いものです。書籍やブログをみて「これは役立ちそうだ」と思っても、ちょっと試すことにさえにも辿り着けず、頓挫しているものがTODOリストやPocket(旧Readitlater)に大量にあります。
#書いていて嫌な気持ちになってきた、、、
Hadoopはそんな面倒なものの一つかもしれません。書籍を読んで「よし、やってみるか」という強い決意を持ったすぐ後、
「試すにはマシンを買わないといけないのかなぁ」
「いや、EC2でいけそう。アカウントどうしようか」
「なんか仮想マシンでもできそうって書いてある」
という第一の壁があります。
運良く壁を乗り越えたあと、
「ソフトはどこからダウンロードすればいいだっけ?」
「コマンドラインでやるの?」
「設定面倒そうだなぁ」
いつやるの?ー>「今でしょ」「今度でいいや!」
というパターンになっていまうことが多いです。良質な書籍も記事も多いのですが、いかんせん最初の壁が高い印象があります。
先月書いたブログ、「Hadoopを10分で試す」シリーズでは、あらかじめ用意されている仮想マシンイメージを使い、最初の敷居を下げることを目的として書いてみました。過去に挫折したことがある方は週末にでも是非!

Hadoopを10分で試すシリーズ