朱晓姝,许桂秋主编2019 年出版253 页ISBN:9787115503510
作者针对大数据问题,分析如何进行大数据的导入,如何使用大数据工具进行快速的数据预处理,以及如何构建数据仓库。详细讲解了Kettle工具的使用、数据集成、Kettle作业项设计等。...
大数据技术丛书 Spark技术内幕 深入解析Spark内核架构设计与实现原理
张安站著2015 年出版202 页ISBN:9787111509646
Spark是不断壮大的大数据分析解决方案家族中备受关注的新增成员。它不仅为分布式数据集的处理提供一个有效框架,而且以高效的方式处理分布式数据集。它支持实时处理、流处理和批处理,提供了All in One的统一...
经管之家主编;董轶群等编著2017 年出版219 页ISBN:9787121319037
Spark作为下一代大数据处理引擎,经过短短几年的飞跃式发展,正在以燎原之势席卷业界,现已成为大数据产业中的一股中坚力量。本书着重讲解了Spark内核、Spark GraphX、Spark SQL、Spark Streaming和Spark MLlib...
杜圣东著2019 年出版236 页ISBN:9787121356841
面对庞杂的大数据智能技术生态,本书对大数据智能的关键技术、问题瓶颈及发展趋势进行了专业解读,首次提出了大数据和人工智能技术融合发展这一主题,并对大数据和人工智能的融合服务架构和关键技术进行了深入剖...
吴春琼著2019 年出版230 页ISBN:9787517074694
本书围绕大数据背景下的数据挖掘及应用问题,从大数据挖掘的基本概念入手,系统地阐述了大数据的基础理论、大数据处理架构Hadoop以及大数据存储与管理研究;由浅入深地论述了数据挖掘的基础理论、大数据挖掘技术...
于戈,申德荣等编著2016 年出版412 页ISBN:9787111518310
本书主要介绍分布式数据库系统和大数据库系统的基本理论与实现技术。全书共分12章,第1章和第2章介绍分布式数据库系统和大数据库系统的基础和背景,主要包括系统的基本概念、体系结构、发展历史、系统分类和主...
孟海东,宋宇辰著2014 年出版278 页ISBN:9787502467807
本书针对数据的海量性、复杂性、高维性、模糊性和不完整性,对数据挖掘技术中的聚类分析和关联规则分析进行了系统的研究。设计与实现了基于密度和自适应密度可达聚类算法、基于簇特征的动态增量聚类算法、并...
沈力主编2019 年出版296 页ISBN:9787302513643
本书共分为11章,分别从大数据现状,电网大数据特征、前景,欧美智慧能源大数据发展现状、典型案例分析、电网大数据技术及发展前景等方面,结合电网行业运营管理现状,向读者分析展示在大数据时代下电网行业面临的机...