こちらのサイトを参考にEMRでHadoop Streamingを試してたんですが、2年も前の記事だったのでちょっと管理画面がかわってたりしました。
せっかく試したので新しい設定画面での設定まわりを画像付きでメモしておきます。
もちろんやってることはナレコムさんの記事と同じ内容です。
クラスター名、ログの吐き出し先S3バケットを設定。
このあたりがちょっとわかりにくかった。
セレクトタブで使いたい機能を選択して"Configure and Add"を選択すると詳細設定画面がひらく、わかりにくいw
ちなみにスクリプトや参考サイトはこちらにまとめてます。
というわけでとりあえず動かすのは簡単だった。
ただまだHadoopのことよくわからず使ってるので改めていろいろ調べねば、という感じ。
でもHadoop StreamingもEMRもいい感じだとわかった。