VLDBにSQL on Hadoopの論文が出ています

備忘録がわりのメモ:
VLDBに「SQL-on-Hadoop: Full Circle Back to Shared-Nothing Database Architectures」というIBMの研究社による論文が公開されていました。

http://www.vldb.org/pvldb/vol7/p1295-floratou.pdf

ParquetとImpala、RCFileとHive、ORCとHive+TezなどをTPC-DSを使ったベンチマークの比較と考察があり、かなり興味深いです。最新バージョンでの比較ではないですが、かなりいろんな角度から比較をしているようなので、この夏に時間をかけてゆっくり読みたいところ。

#HDFS cachingの恩恵などもあるので、Imapala1.4はもっと速い(はず)

vldb

Pocket

One thought on “VLDBにSQL on Hadoopの論文が出ています

  1. Pingback: Cloudera Impalaの論文 (CIDR 2015) | Tech Blog

Leave a Reply

Your email address will not be published. Required fields are marked *

CAPTCHA


日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)