Hadoop、Spark、ビッグデータ関連書籍

発売予定の書籍も含めたHadoop、Sparkなど関連書籍のまとめです。

オライリーの本を中心に掲載していますが、読んだことがある/手元にある/買おうかなと思っている書籍を中心にまとめているので、全てを網羅しているわけではありません。

当初はブログで公開していましたが、更新が多いので独立したページとしました。(コメントは私見です。素晴らしい書籍ばかりです)

最終更新:2017/2/11

  • 2017/2/1 Spark: The Definitive Guide、Spark Operations Cookbook、Introduction to Spark Operations、(Spark関連書籍)Hadoop in the Enterprise: Architecture (Hadoop関連)追加
  • 2016/11/18 Moving Hadoop to the Cloud 追加 (Hadoopなど、その他)
  • 2016/10/23 Learning Spark Streaming, Advanced Analytics with Spark 2nd Edition 追加 (Spark関連書籍)
  • 2016/7/8: Programming Pig 2nd Edition リンクを追加 (Hadoopエコシステム関連書籍)
  • ちょっと古めの本は別のページに移動しました

Hadoop関連書籍

 TitleRelease date和書名出版日雑感
picture978-4-87311-629-7Hadoop: The Definitive Guide, 3rd Edition2012/5Hadoop 第3版2013/7言わずと知れたHadoop本のバイブル
rc_catHadoop: The Definitive Guide, 4th Edition2015/3ついに正式版公開!日本語版はいつかな〜。
picture978-4-87311-652-5Hadoop Operations2012/9Hadoopオペレーション2013/11通称パカ本。運用するならこれを読むべき。YARNには対応していないところが少し残念
hop2ndHadoop Operations 2nd edition2016/7(予定)ついに書籍情報が掲載。これは期待せざるを得ない(2015/7/6)
rc_cat_aaHadoop Application Architectures 2015/6かなり面白い。おすすめ。日本語にならないかなぁ。。
LHadoop徹底入門 第2版2013/8日本語で読めるHadoop書籍定番の一冊。YARNもある。3版の出版を期待(笑
rc_cat_secHadoop Security2015/6今後エンタープライズでの利用が増えるHadoopでのセキュリティトピックは避けられない。
cat_mdMapReduce Design Patterns2012/11MapReduceのデザインパターンを知りたいならこれ?まだあまり読んでない
mrdp2MapReduce Design Patterns2016/10いつの間にか2版も出るらしい
cat_ehEnterprise Hadoop2015/12(予定)2015/1/14追記
MapReduce Design Patternの著者による執筆らしいです
heaEnterprise Hadoop2017/7(予定)2017/1/31追記
HBase(馬本)のLars、Clouderaの精鋭による書籍らしいです
cat_daData Analytics with Hadoop2015/11買ってみたが読んでない
bigdata_for_chimpsBig Data for ChimpsPigの話なども出ているらしい

Hadoop/NoSQL関連書籍

 TitleRelease date和書名出版日雑感
picture978-4-87311-566-5HBase definitive Guide (1st Edition)2011/3HBase2012/7HBase本のバイブル。一番愛用しているかも?
hbase2ndHBase definitive Guide 2nd Edition2014/8(予定)(2015/5)Early Release登場!
rc_cat_acAccumulo2015/2(予定)
Early Releaseあり
Google BigTableのNSAによる実装、Accumulo。必要になったら読む
LjHBase徹底入門 Hadoopクラスタによる高速データベースの実現CDH5.2.1でHBase0.98に対応。1.0に関する情報もあり新しい。サンプルアプリも充実し、運用からチューニングの話題と豊富。
architecting_hbase_apphttp://shop.oreilly.com/product/0636920035688.do2016/1予定2015/7/6追加。デザインパターンやサイジング、ベストプラクティスなども網羅されるらし。楽しみ。

Hadoopエコシステム関連書籍

NoTitleRelease date和書名出版日雑感
cat_imGetting Started with Impala2014/10MPP SQLエンジンのCloudera Impalaの本。Cloudera Impalaフリーブックの完全版かな?
picture978-4-87311-672-3Cloudera Impala2013/11Cloudera Impala2014/3上記、去年公開されたImpala本のベース?無償でダウンロードできるeBook。
picture978-4-87311-617-4Programming Hive2012/9プログラミング Hive2013/6Hive遣いなら読んでおいた方が良い?
hive2Programming Hive, 2nd Edition2017/1 (予定)ついに2版が!Hive on Spark入るかな?
cat_pigProgramming Pig2011/9個人的に、日本語書籍がないのは残念。
pig2Programming Pig, 2nd Edition2016/7Pigの2版、アーリーリリースが買えるようになった。Spark登場でユーザー数は減っている!?
picture978-4-87311-662-4Apache Sqoop Cookbook2013/7Apache Sqoop クックブック2014/3日本語は電子書籍版のみ
cat_flumeUsing Flume2014/10KafkaやMorphlineなど、いろいろ勉強のために頑張って読む
rc_cat_oozieApache Oozie2015/52015/5 正式リリース
Oozie本。
practical_hivePractical Hive
2016/10Hive本。読んでいないので詳細は不明

Spark関連書籍

 TitleRelease date和書名出版日雑感
sdgSpark: The Definitive Guide2017/1 (Early Release)2017/1/31追加: ついに本命が登場
cat_lsLearning Spark2015/2初めてのSpark2015/8日本語版も発売中
SparkAdvanced Analytics with Spark2015/4Sparkによる実践データ解析2016/1ClouderaのデータサイエンティストチームによるSparkでのクラスタリングや機械学習などのアルゴリズムに関する書籍
aas2ndAdvanced Analytics with Spark 2nd edition2017/5(仮)Advanced Analytics with Sparkの第2版
learning_ssLearning Spark Streaming2017/7New! Spark Streamingの本。発売が楽しみ
cat_lsHigh Performance Spark2016/7(予定)Early Releaseが購入できます。良さげです。
socSpark Operations Cookbook2017/7(予定)2017/2/1追加。まだ詳細不明
Introduction to Spark Operations2017/6(予定)2017/2/1追加。まだ詳細不明
catSpark in Action2017/1 (?)発売されています。Spark 2.0にも対応
malak_cover150Spark GraphX in Action?発売されています。
SparkApache Spark入門2015/10/26発売されました!
sparkdetail詳解 Apache Spark2016/4/29New! 新刊が出るようです

Hadoopなど、その他

NoTitleRelease date和書名出版日雑感
hadoop_cloud Harnessing Cloud Features and Flexibility for Hadoop Clusters Larger Cover Moving Hadoop to the Cloud2016/11(?)いよいよHadoop on クラウドの本もが出てきましたね (2016/11)
picture978-4-87311-584-9Mahout in Action2011/10Mahoutイン・アクション2012/10若干バージョンは古いがMahoutの唯一の日本語本。MLlibやOrix本も出ないかしら?ちなみにSpark関連書籍にも機械学習の話題は出てる
picture978-4-87311-671-6Agile Data Science2013/10アジャイルデータサイエンス2014/4Apache Pigの話題などもあります
rc_cat_daData Algorithms2015/3(予定)@tamagawa_ryujiさん推薦。これはなかなかヘビーな内容
data_intensive_appDesigning Data-Intensive Applications2016/1 (予定)アーリーリリースを斜め読みした感じですが、幅広い技術を扱っていて良さげです。 (2015/7)
kafkaKafka The Definitive Guide2016/7 (予定)ついに登場する!?

 

Pocket

Leave a Reply

Your email address will not be published. Required fields are marked *

CAPTCHA


日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)