(澳)理查德劳森(RichardLawson)著2016 年出版157 页ISBN:9787115431790
本书讲解了如何使用Python来编写网络爬虫程序,其内容包括从网页中提取数据,构建线程爬虫来并行处理页面信息,通过连接来爬取网站的数据,提取缓存中的数据,使用多个线程和进程来加速爬取,分析非JavaScript开发的站...
(德)凯瑟琳·雅姆尔(Katharine Jarmul),(澳)理查德·劳森(Richard Lawson)2018 年出版196 页ISBN:9787115479679
本书包括网络爬虫的定义以及如何爬取网站,如何使用几种库从网页中抽取数据,如何通过缓存结果避免重复下载的问题,如何通过并行下载来加速数据抓取,如何利用不同的方式从动态网站中抽取数据,如何使用叔叔及导航等...