Amazon Elastic MapReduceテクニカルガイド ―クラウド型Hadoopで実現する大規模分散処理― 中古価格 |
日本語でEMRについての本というとこれしかないようですね。
2011年末に書き上げたと冒頭部分にあるのでたしかに情報が古い部分もありますが、とはいえ基本的なことはかわってないようなので参考になります。
とくにEMR固有の用語などはかわってないようですのでそのあたりがまとまっているだけでも参考になります。
というわけでいろいろとHadoopまわりを調べてはいるのですが、最初思っていたのと違い、Hadoop StreamingではなくHiveまたはPigやらでまずはやりたいことをやってみる方がいいような気がしてきました。とくにHiveでやりたいことがやれるならそれにこしたことはないような。
つぎはHiveについて調べてみます、では。