翟周伟著2015 年出版387 页ISBN:9787111494683
这是一本技术深度与企业实践并重的著作,由百度顶尖的Hadoop技术工程师撰写,是百度Hadoop技术实践经验的总结。本书使用、实现原理、运维和开发4个方面对Hadoop的核心技术进行了深入的讲解:(1)使用:详细讲解了HDFS...
(美)DouglasEadline著;卢涛,李颖译2016 年出版271 页ISBN:9787121288050
本书首先介绍了Hadoop的背景知识,包括Hadoop 2和YARN的工作原理和对Hadoop 1的改进,然后将数据湖与传统存储比较。第2章到第8章,分别介绍了Hadoop 2和核心服务的安装方法、Hadoop分布式文件系统、MapReduce和Y...
叶晓江,刘鹏编著2016 年出版505 页ISBN:9787121285646
书是刘鹏教授主编的国内第一本Hadoop编程书籍《实战Hadoop》的第二版。Hadoop堪称业界最经典的开源云计算和大数据平台软件。本书系统介绍了Hadoop 2.0生态圈的核心和扩展组件,包括:管理工具Ambari、分布式文...
Python+Spark 2.0+Hadoop 机器学习与大数据实战
林大贵著2018 年出版519 页ISBN:9787302490739
本书详细介绍如何模拟云计算的虚拟环境的架设与计算机网络设定外,并且介绍基础软件下载与安装,按部就班地利用简单的范例程序与网络所收集数据,让读者从实际的操作中,很踏实地学习到,如何利用多台计算机所架设的...
温春水,毕洁馨编著2019 年出版348 页ISBN:9787111619314
本书针对愿意加入大数据行业的初学者量身定做,以简练风趣的语言介绍了大数据程核心技术及相关案例。内容包括了数据的基本概念、Hadoop的安装与配置、HDFS、基于Hadoop3的HDFS高可用、Zookeeper、MapReduce...
(美)马哈默德·帕瑞斯安(Mahmoud Parsian)2016 年出版680 页ISBN:9787512395947
本书介绍了很多基本设计模式、优化技术和数据挖掘及机器学习解决方案,以解决生物信息学、基因组学、统计和社交网络分析等领域的很多问题。这本书还概要介绍了MapReduce、Hadoop和Spark。本书主要内容包括:完...
Tom White著;王海,华东,刘喻,吕粤海译2017 年出版708 页ISBN:9787302465133
本书主题包括:用HDFS存储大数据集,用MapReduce做分布式计算,使用Hadoop的数据和I/O构件来做压缩、数据集成、序列化和持久化,发现常见的陷阱和实用性MapReduce程序设计的高级特性,设计、构建和管理专用Hadoop数...
Hadoop技术内幕 深入解析MapReduce架构设计与实现原理
董西成著2013 年出版320 页ISBN:9787111422266
本书旨在通过源代码来解析MapReduce的架构设计与实现原理。全书分为四个部分:第一部分(1~2章),介绍Hadoop源代码的组织结构、获取、编译、调试、阅读环境的搭建,以及MapReduce的设计理念和基本架构;第二部分(第3章),....
(美)萨米尔·瓦德卡,(美)马杜·西德林埃,(美)杰森·文纳著;于博,冯傲风译2016 年出版386 页ISBN:9787111515654
本书作者基于对Hadoop系统的实践,深入浅出地对Hadoop进行了详细的讲解,包含大量的实例和技巧,可帮助有一定基础的开发者快速掌握分布式系统。主要内容包括:第1章~第4章讲解大数据系统的基本概念、Hadoop系统的关...
魏祖宽,刘兆宏编著2017 年出版260 页ISBN:9787121317392
本书基于云计算和大数据,介绍大数据处理和分析的技术,分为两部分。第一部分介绍Hadoop基础知识,内容包括:Hadoop的介绍和集群构建、Hadoop的分部式系统架构、MapReduce及其应用、Hadoop的版本特征及进化。第二...