夏换,杨秀璋,于小民编著2019 年出版283 页ISBN:9787030606365
随着计算机和互联网技术的飞速发展和广泛普及,互联网已经成为人类获取知识的最大平台。在爬取了Web网页语料后,需要通过数据预处理和数据分析来获取数据的价值,从而造福人类,推动社会发展。本书主要是Web大数据...
杨秀璋,颜娜编著2018 年出版288 页ISBN:9787512427129
本书,主要内容包括Python基础知识、正则表达式、BeautifulSoup技术、Selenium技术、Scrapy框架、数据库存储等,并详细介绍了爬取个人博客网站、电影信息、招聘信息、在线百科、微博信息、图集网站、农产品信...
杨秀璋,颜娜编著2018 年出版248 页ISBN:9787512427136
本书主要内容包括Python常用数据分析库、可视化分析、回归分析、聚类分析、分类分析、关联规则挖掘分析、数据预处理及文本聚类、词云热点与主题分布分析、复杂网络与基于数据库技术的分析等。本书既可作为...
夏换,杨秀璋,于小民编著2019 年出版275 页ISBN:9787030606372
本书主要是基于Python的Web大数据爬取实战指南,选题内容包括基础知识和通过Python爬取Web网页数据两大部分。下图是PythonWeb数据采集的结构图,主要包括三个部分:网络传播技术、信息提取技术和数据存储技术。...