内容説明
Hadoopは、多数のコンピュータを束ねて極めて大きな処理ができるオープンソースソフトウェアです。MapReduceというJavaフレームワークでプログラミングできるほか、標準入出力が使えるHadoopStreaming、フロー記述環境Pig、SQL風インターフェイスであるHiveなど多彩な環境を備えています。また、行指向DBのHBaseやログコレクタのFluentdの基盤としても利用できるなど、Hadoopには高い汎用性があります。第2版である本書では、実システムで多く利用されているCloudera社のCDH4ディストリビューションを軸に、システムの拡張や監視、メンテナンス方法など、より現場での利用を意識した最新のノウハウをまとめました。Hadoopを導入してその効果を得るためのいろいろな情報をまとめた一冊です。
目次
第1部 Hadoopの基礎(Hadoopの基礎知識;MapReduceアプリケーションの活用例 ほか)
第2部 MapReduceアプリケーション開発(MapReduceプログラミングの基礎―Javaによる開発(1)
MapReduceプログラミングの応用―Javaによる開発(2) ほか)
第3部 Hadoopクラスタの構築と運用(環境構築の効率化;可用性の向上 ほか)
第4部 Hadoopを活用するための技術(Hadoopチューニング;分散型データベースHBase ほか)
著者等紹介
濱野賢一朗[ハマノケンイチロウ]
株式会社NTTデータ基盤システム事業本部シニアエキスパート。1998年頃よりずっとLinux/OSS分野で活動しているが、最近はHadoopの導入支援や普及推進活動に注力している。分散処理のアーキテクチャが今後のITシステムにどう浸透できるか模索しながら取り組んでいる。株式会社びぎねっと取締役副社長、リナックスアカデミー学校長を経て、2008年より現職(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。