高彦杰,倪亚宇著2016 年出版214 页ISBN:9787111523079
本书一共11章:其中第1~3章,主要介绍了Spark的基本概念、编程模型、开发与部署的方法;第4~11章,详细详解了热点新闻分析系统、基于云平台的日志数据分析、情感分析系统、搜索引擎链接分析系统等的应用与算法等核心...
黄申著2017 年出版425 页ISBN:9787111569695
本书介绍了一些主流技术在商业项目中的应用,包括机器学习中的分类、聚类和线性回归,搜索引擎,推荐系统,用户行为跟踪,架构设计的基本理念及常用的消息和缓存机制。在这个过程中,我们有机会实践R、Mahout、Solr、E...
Linux内核设计的艺术图解Linux操作系统架构设与实现原理 第2版
新设计团队著2013 年出版455 页ISBN:9787111421764
作者结合第一版在市场上得到的读者反馈,以及作者用这本书作为中科院研究生的教材时得到的学生反馈,对这本书进行了重写,思路上有了比较大的调整,使得本书的内容质量又有了大幅度的提升。本书以图示化为核心,以操...
高建良,盛羽编著2019 年出版371 页ISBN:9787548735748
本书主要内容包括:Spark大数据编程环境、Spark 工作机制、Spark SQL编程、SparkStreaming流式编程、Spark Graphx 图编程等。已有Spark大数据编程类书籍以讲解概念为主,本书将首次将Spark大数据真正落到实处,...
Spark亚太研究院,王家林编著2015 年出版800 页ISBN:9787121247446
Life is short,you need Spark!Spark是当今大数据领域最活跃最热门的高效的大数据通用计算平台,基于RDD,Spark成功的构建起了一体化、多元化的大数据处理体系,本书完全从企业处理大数据业务场景的角度出发,完全...
(美)马哈默德·帕瑞斯安(Mahmoud Parsian)2016 年出版680 页ISBN:9787512395947
本书介绍了很多基本设计模式、优化技术和数据挖掘及机器学习解决方案,以解决生物信息学、基因组学、统计和社交网络分析等领域的很多问题。这本书还概要介绍了MapReduce、Hadoop和Spark。本书主要内容包括:完...
耿嘉安著2016 年出版470 页ISBN:9787111522348
本书分为三大部分:第一部分为准备篇(第1~2章),简单介绍了Spark的环境搭建和基本原理,帮助读者了解一些背景知识。第二部分为核心设计篇(第3~7章),着重讲解SparkContext的初始化、存储体系、任务提交与执行、计算引......
(美)IlyaGanelin等著;李刚译2017 年出版205 页ISBN:9787121313646
本书针对spark从验证性环境迁移到实际生产环境时会遇到的各种问题给出了实际的帮助,涵盖了开发及维护生产级Spark应用的各种方法、组件与有用实践。全书分为6章,第1~2章帮助读者深入理解Spark的内部机制以及它...
企业大数据处理 Spark、Druid、Flume与Kafka应用实践
肖冠宇著2017 年出版210 页ISBN:9787111579229
本书分为三大部分,共九章。第一部分(第1章)主要介绍了企业大数据系统的前期准备工作,包括如何构建企业大数据处理系统的软件环境和集群环境。第二部分(第2~7章)首先介绍了Spark的基本原理,Spark 2.0版本的Spark SQL...