オライリーのHadoop関連本リリース予定 (2014/8時点)

最近、米O’ReillyからHadoop関連書籍の出版予定が目白押しです。リリース予定がわかりにくいので、表にまとめてみました。

2015/1/8補足: 最新情報は別ページにまとめました

Hadoopをエンタープライズで利用したい方は必読ですね。(ちょっとリリースラッシュで積ん読になりそうなところが怖いです)

もちろん、日本語に翻訳されるのも楽しみです 🙂

NoTitleRelease date和書名出版日雑感
1Hadoop: The Definitive Guide, 3rd Edition2012/5Hadoop 第3版2013/7言わずと知れたHadoop本のバイブル。第4版はそろそろか?
2HBase definitive Guide (1st Edition)2011/3HBase2012/7HBase本のバイブル。一番愛用しているかも?現在、HBaseの第2版を執筆中とか
3Hadoop Operations2012/9Hadoopオペレーション2013/11運用するならこれを読むべき。YARNには対応していないところが少し残念だが、それ以外は十分すぎるぐらい役立つ
4Programming Hive2012/9プログラミング Hive2013/6Hive遣いなら読んでおいた方が良い?
5Programming Pig2011/9個人的に、日本語書籍がないのは残念。
6Apache Sqoop Cookbook2013/7Apache Sqoop クックブック2014/3PDF版のみ
7MapReduce Design Patterns2012/11MapReduceのデザインパターンを知りたいならこれ?まだあまり読んでない
8Hadoop Application Architectures 2015/4(予定)来年出版予定。Early Releaseを読んだが、まだあまり深い内容はない。かなり期待。
9Hadoop Security2015/2(予定)Hadoopでのセキュリティが避けられないってことでしょうね。来年はこれがメインの一冊になるかも
10Accumulo2015/2(予定)Google BigTableのNSAによる実装、Accumulo。必要になったら読む
11Learning Spark2015/2(予定)Sparkのトレーニング用に熟読中。ウチのテキストの方が図が多くて分かり易いとは思うけど、後半のチャプターに期待。
12Getting Started with Impala2014/10(予定)MPP SQLエンジンのCloudera Impalaの本。Cloudera Impalaフリーブックの完全版かな?
13Cloudera Impala2013/11Cloudera Impala2014/3上記、去年公開されたImapala本のベース?無償でダウンロードできるeBook。
14Using Flume2014/10(予定)KafkaやMorphlineなど、いろいろ勉強のために頑張って読む
15Hadoop Hacks2012/4日本語のみだが多くのTipsがあり役立つ。若干内容に古いところもあり。
16Data-Intensive Text Processing with MapReduce2010Hadoop MapReduce デザインパターン2011/10原書はO'Reillyではなく、MapReduce Design Patternの訳書ではない。原書はPDFで無料公開されているが、日本語で読みたい方にはお勧め
17Mahout in Action2011/10Mahoutイン・アクション2012/10若干バージョンは古いがMahoutの唯一の日本語本。MLlibやOrix本も出ないかしら?
18Agile Data Science2013/10アジャイルデータサイエンス2014/4Apache Pigの話題などもあります
19Data Algorithms2015/1(予定)@tamagawa_ryujiさん推薦。これはなかなかヘビーな内容

 

CDH5 ベータ1 のNFSv3ゲートウェイを試してみました

HDFSのNFSv3 Gateway機能を試してみる

以前の記事にも書きましたが、Hadoop 2.2.0の新機能の一つに「NFSv3に対応」という点があります。「CDH5 beta1を速攻で試す!」でCDH5b1のパッケージをみたように、NFSv3 GatewayはCDH5 b1にも含まれています。制約は多いようですが、モノは試しに使ってみましょう。 (続きを読む)

「Hadoopを40分で理解する」のスライド公開!

(2014/12/10追記)Hadoop入門になりそうなブログをまとめたページを作成しました。-> Hadoopを10分で試す

Cloudera World 2013の資料が公開されました

先週開催されたCloudera World Tokyo 2013、資料が公開され始めました。
http://www.cloudera.co.jp/cwt2013-session.html

まだ全てのスライドは揃っていませんが、順次公開されるとのこと。
Hadoopを40分で理解する」のスライド(pdf)もダウンロードできるようになっています。

スライドシェアにも上げてあります。

#cwt2013

Hadoop誕生7周年

本日はHadoop生誕(?)7周年だそうです。おめでとうございます!

http://blog.cloudera.com/blog/2013/04/seven-thoughts-on-hadoops-seventh-birthday/

#姪っ子がちょうど今年の春で7歳だったな。

7年前って言うとRHEL4u3(*1)の直後、Windows Vista(*2)も登場していない時代。iPhoneもまだこの世に誕生していなかったんですね。ビッグデータやCloudっていう言葉も流行っていなかった、かなり遠い昔のような気もします。

でもMySQLは5.0がリリースされ、Postgresも8.xだったということを考えると、7年間でエンタープライズで利用されるまでに進化したってのは凄いスピードかと。Oracle10gがリリースされたのは2003年ですよ?
これからも微力ながらHadoopに貢献していければと思います。

下記は記念すべき最初の 0.1.0 版のアナウンスメール。いいですね〜

http://mail-archives.apache.org/mod_mbox/hadoop-common-dev/200604.mbox/%3C44302987.4090506@apache.org%3E

*1 Wikipedia Red Hat Enterprise Linux
*2: Wikipedia Windows Vista