(美)马哈默德·帕瑞斯安(Mahmoud Parsian)2016 年出版680 页ISBN:9787512395947
本书介绍了很多基本设计模式、优化技术和数据挖掘及机器学习解决方案,以解决生物信息学、基因组学、统计和社交网络分析等领域的很多问题。这本书还概要介绍了MapReduce、Hadoop和Spark。本书主要内容包括:完...
张良均等著2016 年出版290 页ISBN:9787111522652
本书共14章,分三个部分:基础篇、实战篇、高级篇。基础篇介绍了数据挖掘、Hadoop大数据的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得大数据项目挖掘分析...
(美)本·斯派维(BenSpivey),乔伊·爱彻利维亚(JoeyEcheverria)著2017 年出版242 页ISBN:9787115467713
本书阐述了Hadoop从早期开放的消费互联网时代到现在作为敏感数据可信平台的演变历程,介绍了包括身份验证、加密、密钥管理和商业实践在内的诸多主题,并在实际环境下加以讨论。第1章是介绍性内容,随后分为四大...
(美)卢博林斯凯著2014 年出版425 页ISBN:9787302369066
本书从Hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍Hadoop这一高性能处理海量数据集的理想工具。内容不仅包括了Apache Hive、Pig、MapReduce、Mahout、Giraph、HDFS、Accumulo、Redis、Ganglia等...
黑马程序员编著2019 年出版290 页ISBN:9787302524403
本书围绕Hadoop生态圈相关系统介绍大数据处理架构。全书共11章,其中,第1-2章主要带领大家认识Hadoop以及学会搭建Hadoop集群。第3-5章讲解了分布式文件系统HDFS、分布式计算框架MapReduce以及分布式协调服务...
(美)斯里达尔·奥拉著;李垚译2019 年出版363 页ISBN:9787302527893
本书详细阐述了与Hadoop 3大数据分析相关的基本解决方案,主要包括Hadoop简介、大数据分析、MapReduce大数据处理、Python-Hadoop科学计算和大数据分析、R-Hadoop统计数据计算、Apache Spark批处理分析、Apac...
(美)乔·塞科(Joe Celko)2016 年出版178 页ISBN:9787115427878
本书是根据作者进行培训和开发的经验编写的NoSQL权威指南,是了解在什么场景、什么时候、为什么NoSQL的好处超过SQL的理想书籍。通过本书,读者可以在对SQL的缺点多于好处的场景有一个完整的理解后,更好地确定何...
Hadoop海量数据处理 技术详解与项目实战 大数据云计算ip 第2版
范东来著2016 年出版353 页ISBN:9787115427465
本书介绍了Hadoop技术的相关知识,并将理论知识与实际项目相结合。全书共分为三个部分:基础篇、应用篇和总结篇。基础篇详细介绍了Hadoop、YARN、MapReduce、HDFS、Hive、Sqoop和HBase,并深入探讨了Hadoop的运...