(美)朱尔尼著2014 年出版165 页ISBN:9787121236198
本书面向大数据挖掘,以敏捷视角呈现高效构建数据模型的全程实践和思路。在一组以一个真实电子邮箱数据挖掘为例的数据价值金字塔进阶模式中,你将学到:一整套实用工具及其他法论,可快速实现在Hadoop上构建数据分...
黑马程序员编著2019 年出版290 页ISBN:9787302524403
本书围绕Hadoop生态圈相关系统介绍大数据处理架构。全书共11章,其中,第1-2章主要带领大家认识Hadoop以及学会搭建Hadoop集群。第3-5章讲解了分布式文件系统HDFS、分布式计算框架MapReduce以及分布式协调服务...
文艾,王磊编著2012 年出版371 页ISBN:9787302282587
Hadoop是目前最主流的云计算开源系统,Hadoop实现了一个高可扩展的分布式文件系统HDFS(Hadoop Distributed File System),HDFS作为Hadoop底层基础设施,为云计算提供高可靠、高性能的云存储服务。因此,Hadoop相关工...
刘刚著2014 年出版408 页ISBN:9787111452447
本书一共分为五个部分:基础篇(1~2章),主要介绍了Hadoop的概念、用途、整个生态环境中的其他技术,以及Hadoop的安装与配置;应用篇(3~6章),分别详细讲解了MapReduce的用法、HDFS的技术细节、I/O的技术细节、MR的工作原.....
翟周伟著2015 年出版387 页ISBN:9787111494683
这是一本技术深度与企业实践并重的著作,由百度顶尖的Hadoop技术工程师撰写,是百度Hadoop技术实践经验的总结。本书使用、实现原理、运维和开发4个方面对Hadoop的核心技术进行了深入的讲解:(1)使用:详细讲解了HDFS...
(美)DouglasEadline著;卢涛,李颖译2016 年出版271 页ISBN:9787121288050
本书首先介绍了Hadoop的背景知识,包括Hadoop 2和YARN的工作原理和对Hadoop 1的改进,然后将数据湖与传统存储比较。第2章到第8章,分别介绍了Hadoop 2和核心服务的安装方法、Hadoop分布式文件系统、MapReduce和Y...
大数据开发者权威教程 NoSQL Hadoop组件及大数据实施
WROX国际IT认证项目组编;顾晨译;黄倩审校2018 年出版457 页ISBN:9787115493712
本系列书涵盖了大数据开发工作的核心内容,全面且详尽地涵盖了大数据开发的各个领域。本书包括大数据的概述、管理大数据生态系统、数据的存储和处理、用Hadoop工具提高效率、Hadoop的高级特性、利用NoSQL数...
温春水,毕洁馨编著2019 年出版348 页ISBN:9787111619314
本书针对愿意加入大数据行业的初学者量身定做,以简练风趣的语言介绍了大数据程核心技术及相关案例。内容包括了数据的基本概念、Hadoop的安装与配置、HDFS、基于Hadoop3的HDFS高可用、Zookeeper、MapReduce...
(美)马哈默德·帕瑞斯安(Mahmoud Parsian)2016 年出版680 页ISBN:9787512395947
本书介绍了很多基本设计模式、优化技术和数据挖掘及机器学习解决方案,以解决生物信息学、基因组学、统计和社交网络分析等领域的很多问题。这本书还概要介绍了MapReduce、Hadoop和Spark。本书主要内容包括:完...
Tom White著;王海,华东,刘喻,吕粤海译2017 年出版708 页ISBN:9787302465133
本书主题包括:用HDFS存储大数据集,用MapReduce做分布式计算,使用Hadoop的数据和I/O构件来做压缩、数据集成、序列化和持久化,发现常见的陷阱和实用性MapReduce程序设计的高级特性,设计、构建和管理专用Hadoop数...