邓立国,佟强著2017 年出版343 页ISBN:9787302479710
本书内容共8章,以Spark为主线阐述云计算环境下大数据处理,重点在大数据与云计算的融合。本书给出了大数据与云计算的一些基本概念的同时,以Spark为开发工具实现云环境下的大数据部署、典型案例算法实现,最后介...
王会举著2016 年出版158 页ISBN:9787307188730
本书以大数据为研究背景,系统分析了传统数据技术当前存在的问题以及面临的挑战,并对比了当前主流的面向大数据的数据库解决方案,在此基础上阐述了笔者的研究工作:基于MapReduce平台高处处理大数据的OLAP研究。...
陈伟杰,石少岩主编2016 年出版332 页ISBN:9787113227241
本书全面介绍了编组站大数据运营网络的构成。详细解析了硬件的组合:通过光缆、网线等传输介质链接,由服务器、磁盘阵列、地面站、基站、交换机、路由器、PC机、打印机、拼接屏、摄像头等终端设备组成现车网络...
牛琨著2017 年出版289 页ISBN:9787563551309
本书以大数据的收集、存储、管理、分析为主要脉络,结合工业及产业界的实际应用,合理设置课程体系。书中系统的梳理了数据挖掘相关技术体系,包括数据采集、数据预处理、聚类、分类、关联规则挖掘、挖掘结果的评...
(美)穆罕默德·古勒著;赵斌,马景,陈冠诚译2017 年出版249 页ISBN:9787111565611
本书是关于大数据和Spark的一个简明手册。它将助你学习如何用Spark来完成很多大数据分析任务,其中覆盖了高效利用Spark所需要知道的重要主题:如何使用Spark Shell进行交互式数据分析、如何编写Spark应用、如...
杨正洪著2016 年出版292 页ISBN:9787302442837
本书共10章,比较全面地介绍了Hadoop技术,内容包括Hadoop技术组成,Hadoop安装与配置,HDFS文件系统,HBase数据库,大数据访问技术,大数据采集,大数据管理,大数据分析,大数据可视化等。...
王崇骏编著2016 年出版396 页ISBN:9787111542612
本书的整体行文是基于“说些历史、话些故事、聊些技术、谈些思考”这样的思路展开的。全书共有13章,逻辑上分为四个部分:第一部分尝试对“数觉→数→数据→大数据”历史脉络进行梳理并陈述社会各界迎接和拥抱...