余辉著2017 年出版337 页ISBN:9787302479673
全书分为三篇,第一篇讲解了Hadoop的原生态组件,包括Hadoop以及Zookeeper、Hbase、Hive环境搭建与安装,以及对MapReduce、HDFS、Zookeeper、Hbase、Hive的原理介绍和实战操作。第二篇讲解了Spark的原生态组件,包...
(美)怀特著2015 年出版730 页ISBN:9787564159177
通过这本综合性指南的第四版,你将会学习到如何通过Apache Hadoop建立和维护可靠的、可扩展的分布式系统。本书是期望分析任意大小的数据集的程序员以及想建立和运行Hadoop集群的管理员的理想选择。在这本面...
范东来著2015 年出版318 页ISBN:9787115380999
本书主要介绍Hadoop技术的相关知识,并将理论知识与实际项目相结合。全书共分为三个部分:基础篇、应用篇和结束篇。基础篇详细介绍了Hadoop、MapReduce、HDFS、Hive和Sqoop,并深入探讨了Hadoop的运维和调优;应...
KevinSitto,MarshallPresser著;陈新,唐晓译2016 年出版109 页ISBN:9787512395985
本书每一章都介绍了不同的主题(例如核心技术或数据传输),并且解释了为什么特定组件适用或不适用特定的需求。对于数据处理来说,使用Hadoop是一个全新的挑战,但如果有了这本便利的参考书,你将很容易领会使用Hadoop...
(美)朱尔尼著2014 年出版165 页ISBN:9787121236198
本书面向大数据挖掘,以敏捷视角呈现高效构建数据模型的全程实践和思路。在一组以一个真实电子邮箱数据挖掘为例的数据价值金字塔进阶模式中,你将学到:一整套实用工具及其他法论,可快速实现在Hadoop上构建数据分...
黑马程序员编著2019 年出版290 页ISBN:9787302524403
本书围绕Hadoop生态圈相关系统介绍大数据处理架构。全书共11章,其中,第1-2章主要带领大家认识Hadoop以及学会搭建Hadoop集群。第3-5章讲解了分布式文件系统HDFS、分布式计算框架MapReduce以及分布式协调服务...
(美)斯里达尔·奥拉著;李垚译2019 年出版363 页ISBN:9787302527893
本书详细阐述了与Hadoop 3大数据分析相关的基本解决方案,主要包括Hadoop简介、大数据分析、MapReduce大数据处理、Python-Hadoop科学计算和大数据分析、R-Hadoop统计数据计算、Apache Spark批处理分析、Apac...
文艾,王磊编著2012 年出版371 页ISBN:9787302282587
Hadoop是目前最主流的云计算开源系统,Hadoop实现了一个高可扩展的分布式文件系统HDFS(Hadoop Distributed File System),HDFS作为Hadoop底层基础设施,为云计算提供高可靠、高性能的云存储服务。因此,Hadoop相关工...
刘刚著2014 年出版408 页ISBN:9787111452447
本书一共分为五个部分:基础篇(1~2章),主要介绍了Hadoop的概念、用途、整个生态环境中的其他技术,以及Hadoop的安装与配置;应用篇(3~6章),分别详细讲解了MapReduce的用法、HDFS的技术细节、I/O的技术细节、MR的工作原.....
陆嘉恒著2012 年出版498 页ISBN:9787111395836
相对于第一版,本书有3个方面的更新:第一,技术更新,所有技术都更新到最新版本;第二,实战性更强,加入了大量的小案例和一个综合性的大案例;第三,更加深入,部分章节增加了高级话题。书中首先通过一个简单的MapRe......