hadoop-logo
ようこそ Tech blogへ!
「これからHadoopを勉強しよう」という方はまず下記のページから

サイトの移行に伴って画像が表示されないなどの不具合が生じています

Kudu

Apache Spark 2.xでKuduを利用する

以前のブログ(Apache SparkでApache Kuduを利用する)の Spark2.x版です。前回のブログからあまり変わっていませんが、前回のブログの手順はSpark2.xで動作しなかったという話を聞いたのでアップデートしておきます...
hadoop

Apache Hadoop 3.0.0 リリース

(2017/12/15更新) 本日 Apache Hadoop v3.0.0 が GA になりました! ハイライトは下記の通り(上記サイトから抜粋して翻訳) HDFS のイレイジャーコーディング — データの耐久性を向上させながらH...
cloudera

ビッグデータ用のデータ管理ツール

先日開催された Cloudera World Tokyo 2017 にて、「Clouderaが提供するエンタープライズ向け運用、データ管理ツールの最新情報の使い方」というセッションで講演させていただきました。セッション申し込みが200名超(...
Uncategorized

Apache Impala

ついにImpalaがApacheのトッププロジェクトになりました!おめでとうございます! The Apache Software Foundation Announces Apache® Impala™ as a Top-Le...
cloudera

Cloudera World Tokyo 2017 開催

2017/11/07に、秋恒例のイベント「Cloudera World Tokyo 2017」が開催されます。 今年は、”ビジネスを変える「データの力」”をテーマに、技術からビジネスまで、例年にも増して多種多様なセッションが用意されている...
hadoop

HDFSの新しい機能3つ

HDFSは分散ファイルシステムとして確固たる地位を築きましたが、NFSのサポートやスナップショットなど、多くの機能が追加されています。 その中で、今後 Hadoop 3 で重要となる「HDFSのイレイジャーコーディング」を含めたCloude...
CDH5

Apache SparkでApache Kuduを利用する

Apache Kudu 1.3 最近Apache Kuduのリードとライトの流れについてのブログが公開され、昨日は日本語でもウェビナーが開催されたりと盛り上がってきた「分散ストレージエンジン」のApache Kuduですが、SQLでのアクセ...
CDH5

Cloudera 5.11リリース

Cloudera 5.11が出たので久しぶりの更新です。 Hadoopも11年目を迎え、日本でも幅広い業種で使われるようになりました。数年前と比較すると圧倒的に使いやすくなっているので、過去に評価してそのままになっている方、既存の基盤で困っ...
HBase

CERNで実施したベンチマークが公開されています

CERNが公開した、 「Apache Hadoopエコシステムにおける、異なるファイル形式とストレージエンジンのパフォーマンス比較」 を日本語化して公開しました。 Apache Avro, Apache Parquet, Apache HB...
impala

Impala Cookbookが2017年版に更新されています

Impalaを使う人なら必見の「The Impala Cookbook」(slideshare)が更新されています。要チェックや。