HDFSの暗号化

Hadoopのセキュリティについての雑記

認証についてはKerberosを使うというのがスタンダードですが、暗号化についても徐々に進んでいます。

ネットワークの暗号化

例えば、ネットワークの暗号化については下記のブログがお勧めです。
http://blog.cloudera.com/blog/2013/03/how-to-set-up-a-hadoop-cluster-with-network-encryption/

ファイルシステムの暗号化

ファイルシステム/ディスクの暗号化は現状対応していないので、LinuxのDevice Mapperを使用したdm-cryptや、eCryptfsの仕組みを利用するしかありません。
ところが先週 Jira に「Hadoop cryptographic file system」というチケット(HDFS-5143)が登録されました。今後どうなるかわかりませんが要注目です。

Sentry

話は逸れますが、Hive/Cloudera Impala用の認可モジュール、SentryもApacheのトッププロジェクトを目指しています。Hadoopがエンタープライズ用途での利用が増えるに従いセキュリティはさらに重要な要件となります。今後の展開が楽しみです。