张利兵著2019 年出版277 页ISBN:9787111623533
本书为读者由浅入深地介绍Apache Flink分布式流式计算框架,从最开始介绍Flink的场景特性、环境准备、编程接口的使用等内容,到对Flink内部一些核心模块的实现原理进行深入讲解,同时对Flink性能优化等内容进行...
朱凯著2018 年出版252 页ISBN:9787111595953
这是一部教你如何从0到1架构与实现一个企业级大数据平台的著作,是作者在大数据和系统架构领域超过20000小时的经验总结。作者从横向视角出发,手把手教你如何拉通Hadoop体系技术栈,以此搭建一个真实可用、安全...
(德)莫尔勒著2010 年出版1040 页ISBN:9787115227430
本书讨论了Linux内核的概念、结构和实现,主要内容包括多任务、调度和进程管理、物理内存管理、编写设备驱动程序、模块机制、虚拟文件系统等。...
吕兆星,郑传峰,宋天龙,杨晓鹏著2017 年出版492 页ISBN:9787111568766
本书分13章,分别从企业大数据战略定位、企业大数据落地实施和价值评估,以及大数据的变革与挑战这三大方面进行撰写,宏观上涵盖了企业战略决策和定位,微观上涵盖了大数据职能、思路、方法、流程、开发、应用、评...
(澳)杰夫瑞·艾文(Jeffrey Aven)著2019 年出版277 页ISBN:9787111620037
本书包括从Spark基本编程到高级编程,再到Spark SQL和机器学习的广泛内容。你会学到如何使用Spark高效管理各种形式的数据:流式数据、结构化数据、半结构化数据,还有非结构化数据。在全书中,精准的主题可以让你...
刘荣辉著2018 年出版309 页ISBN:9787568136853
在信息化社会的浪潮中,大量数据由互联网事务交易、社交网络的活动、移动设备以及科研仪器等生成。它的爆炸式增长已超出了传统IT基础架构的处理能力,给企业和社会带来严峻的数据管理问题。因此必须开发新的数...
(美)里扎等著2015 年出版226 页ISBN:9787115404749
本书是使用Spark进行大规模数据分析的实战宝典。四位来自Cloudera的数据科学家不仅讲解了Spark,还通过实例讲解了统计方法、数据处理技术等各种解决现实问题的方法。本书涉及的数据分析模式包括分类、协同过...
高性能分布式计算系统开发与实现 基于Hadoop、Scalding和Spark
(印)K. G.斯里尼瓦沙(K. G. Srinivasa),(印)阿尼尔·库马尔·穆帕拉(Anil Kumar Muppalla)著2018 年出版234 页ISBN:9787111601531
本书分两部分,共8章,介绍了如何使用开源工具和技术开发与实现大规模分布式处理系统,涵盖构建高性能分布式计算系统的方法和最佳实践。第一部分(第1~4章)介绍了高性能分布式计算编程的基础知识,包括分布式系统、Ha...
范煜著2017 年出版236 页ISBN:9787302466932
信息技术革命给我们留下大量数据,在生活和工作中利用这些数据辅助决策,会带领我们进入一个新时代 - 数据时代。本书从迎接数据革命、认识数据革命、推动数据革命、进行数据革命、实现数据革命、工业数据革命...
魏占营,陈学霞,马浩著2018 年出版192 页ISBN:9787307206410
本书主要介绍了车载激光测量数据智能化后处理技术SWDY的深入解析与应用。全书共分11章,主要包括车载激光测量系统及点云处理软件介绍、SWDY的设计目标与模块划分、同步影像、车载点云三维可视化、SWDY的相关...