精通Python爬虫框架Scrapy

精通Python爬虫框架Scrapy

评分

★★★★★

ISBN

9787115474209

出版社

人民邮电出版社 2018-02-01出版

译者

李斌

分类

编程设计

内容简介
《精通Python爬虫框架Scrapy》以Scrapy 1.0版本为基础,讲解了Scrapy的基础知识,以及如何使用Python和三方API提取、整理数据,以满足自己的需求。 本书共11章,其内容涵盖了Scrapy基础知识,理解HTML和XPath,安装Scrapy并爬取一个网站,使用爬虫填充数据库并输出到移动应用中,爬虫的强大功能,将爬虫部署到Scrapinghub云服务器,Scrapy的配置与管理,Scrapy编程,管道秘诀,理解Scrapy性能,使用Scrapyd与实时分析进行分布式爬取。本书附录还提供了各种软件的安装与故障排除等内容。
AI简介
这是一本以Scrapy 1.0版本为基础,深入讲解Scrapy的基础知识,以及如何使用Python和三方API提取、整理数据,以满足自己的需求的实用书籍。书中涵盖了Scrapy基础知识,理解HTML和XPath,安装Scrapy并爬取一个网站,使用爬虫填充数据库并输出到移动应用中,爬虫的强大功能,将爬虫部署到Scrapinghub云服务器,Scrapy的配置与管理,Scrapy编程,管道秘诀,理解Scrapy性能,使用Scrapyd与实时分析进行分布式爬取等内容。 本书以Scrapy框架的概述为起点,介绍了Scrapy框架的架构、功能以及使用方法。然后,深入讲解了Scrapy的性能优势,包括其高效处理残缺HTML的能力,强大的社区支持,代码组织管理,以及其性能模型的设计。此外,书中还详细介绍了自定义Item,以及如何通过Scrapy框架,将爬取到的数据有效地处理并存储到不同的位置,如数据库、接口API,以及遗留应用中。 书中还讲解了如何通过Scrapy框架,将爬取到的数据有效地处理并存储到不同的位置,如数据库、接口API,以及遗留应用中。同时,书中还详细介绍了登录过程的抓取技巧,包
阅读/下载地址