书籍介绍
本书旨在通过源代码来解析MapReduce的架构设计与实现原理。全书分为四个部分:第一部分(1~2章),介绍Hadoop源代码的组织结构、获取、编译、调试、阅读环境的搭建,以及MapReduce的设计理念和基本架构;第二部分(第3章),着重讲解MapReduce的编程接口,主要包括旧API和新API两套编程接口,以及Hadoop工作流;第三部分(4~8)主要分析了MapReduce的运行时环境,包括RPC框架、客户端、JobTracker、TaskTracker和Task等的内部实现细节和机制剖析;第四部分(9~12)深入讲解了Hadoop的性能优化、多用户作业调度器、安全机制和下一代MapReduce框架等高级主题。