书籍介绍
本书由业界拥有10余年开发经验的Java专家亲自执笔,权威性毋庸置疑。全书以介绍Hadoop的基础架构和源代码实现结构开篇,深入透彻地剖析了Hadoop最重要的两个组成部分:Hadoop分布式文件系统和Map/Reduce数据处理框架。其中HDFS实现篇从分布式文件系统的角度出发,分析了HDFS的名字节点,数据节点和HDFS客户端,完整地介绍了一个大规模数据存储系统的实现。Map/Reduce实现篇在介绍Map/Reduce API的基础上,对作业节点,任务节点和客户端进行了剖析,充分地介绍了Hadoop如何实现Map/Reduce的设计目标。通过本书,读者不仅能全面了解Hadoop框架的优秀架构和设计思想,而且还能从Hadoop优雅的实现源码中一窥Java开发的精髓和分布式系统的精要。无论读者是一般的Java极其相关技术开发者,还是Hadoop应用开发者,抑或是平台开发人员和架构师,都能从本书中受益。