(美)里扎等著2015 年出版226 页ISBN:9787115404749
本书是使用Spark进行大规模数据分析的实战宝典。四位来自Cloudera的数据科学家不仅讲解了Spark,还通过实例讲解了统计方法、数据处理技术等各种解决现实问题的方法。本书涉及的数据分析模式包括分类、协同过...
(美)桑迪·里扎等著;龚少成;邱鑫译2018 年出版226 页ISBN:9787115482525
本书是使用Spark进行大规模数据分析的实战宝典,在第1版的基础上,针对Spark近年来的发展,对样例代码和所使用的资料进行了大量更新。本书能为关注Spark发展趋势的读者提供与时俱进的资料,例如Spark 2.0中Dataset...
(美)里扎等著2015 年出版262 页ISBN:9787564159108
在这本实用书籍中,四位Cloudera公司的数据科学家讲解了一系列自包含模式,用于在Spark中进行大规模数据分析。本书作者们把Spark、统计原理和现实世界中的数据集合放到一起,通过实例教你如何解决数据分析问题。...
Spark实时大数据分析 基于Spark Streaming框架
(美)祖贝尔·纳比著;王胜夏,景玉译2018 年出版241 页ISBN:7302511878
于俊等著2016 年出版300 页ISBN:9787111523543
本书共分为四大部分:基础篇(1~10章)介绍了Spark的用途、扩展、安装、运行模式、程序开发、编程模型、工作原理,以及Spark SQL、Spark Streaming、MLlib、GraphX、Bagel等重要的扩展;实战篇(11~14)讲解了搜索结果的排...
高彦杰,倪亚宇著2016 年出版214 页ISBN:9787111523079
本书一共11章:其中第1~3章,主要介绍了Spark的基本概念、编程模型、开发与部署的方法;第4~11章,详细详解了热点新闻分析系统、基于云平台的日志数据分析、情感分析系统、搜索引擎链接分析系统等的应用与算法等核心...
(澳)杰夫瑞·艾文(Jeffrey Aven)著2019 年出版277 页ISBN:9787111620037
本书包括从Spark基本编程到高级编程,再到Spark SQL和机器学习的广泛内容。你会学到如何使用Spark高效管理各种形式的数据:流式数据、结构化数据、半结构化数据,还有非结构化数据。在全书中,精准的主题可以让你...