书籍介绍
本书内容:第一部分为基础篇,简单地介绍Hadoop YARN的环境搭建和基本设计架构,帮助读者了解一些基础背景知识。第二部分为YARN核心设计篇,着重讲解YARN基本库、应用程序设计方法和运行时环境的实现,包括ResourceManager、NodeManager和资源调度等关键组件的内部实现细节。第三部分为计算框架篇,主要讲解当前比较流行的可运行在YARN上的计算框架,包括离线计算框架MapReduce、DAG计算框架Tez、实时计算框架Storm和内存计算框架Spark.第四部分为高级篇,主要介绍了几个类似于Hadoop YARN的开源资源管理系统,包括Corona、Mesos等,并总结了资源管理系统的特点及发展趋势。另外本书最后还添加了几个附录:附录A为YARN安装指南;附录B介绍了常见的YARN配置参数;附录C介绍了常用的Hadoop Shell命令。