MapReduceの中間データを保持する(2)

昨年の夏、ブログ、MapReduceの中間データを保持する、を書いてからその後全く確認をしていなかったところ、何とCDH4.1.1で動かないことが判明!(当時はCDH4のリリース前だったので、CDH3で検証していた)

結果として原因は些細なことでしたが、かなり試行錯誤してしまい、MLなどで情報収集しても解決せずでした。同様の問題に悩んでいる方もいらっしゃるようです。訂正かつ補足します。

2. 条件に基づいてファイルを残す
(続きを読む)