Python 3反爬虫原理与绕过实战

评分

★★★★★

ISBN

9787115528735

出版社

人民邮电出版社 2020-01-10出版

作者

韦世东

分类

编程设计

内容简介

本书首先介绍了开发环境的配置，接着讨论了Web网站的构成和页面渲染、动态网页和静态网页对爬虫造成的影响，紧接着详细介绍了信息校验型反爬虫、动态渲染反爬虫、文本混淆反爬虫知识、特征识别反爬虫的原理、实现和绕过，然后概览了App数据爬取的关键和常用的反爬虫手段，最后介绍了常见的编码和加密原理、JavaScript代码混淆知识、前端禁止事件以及与爬虫相关的法律知识和风险点。

AI简介

这是一本深入探讨Python 3编程语言在网络爬虫和反爬虫领域的应用与实践的著作。书中首先介绍了开发环境配置，包括操作系统的选择、练习平台Steamboat的搭建、第三方库的安装、常用软件的安装以及深度学习环境配置等。接着，书籍讨论了Web网站的构成和页面渲染，详细解析了nginx服务器、浏览器、网络协议等关键概念，并总结了网页渲染的全过程。书中深入讲解了爬虫与反爬虫的相关知识，包括动态网页与网页源代码的关系、爬虫知识回顾以及反爬虫的概念与定义。在此基础上，书籍详细介绍了信息校验型反爬虫、动态渲染反爬虫、文本混淆反爬虫以及特征识别反爬虫的原理、实现和绕过方法。此外，书籍还概览了App数据爬取的关键和常用的反爬虫手段，包括App抓包、APK文件反编译、代码混淆以及App应用加固等知识。书籍最后介绍了常见的编码和加密原理、JavaScript代码混淆知识、前端禁止事件以及与爬虫相关的法律法规和风险点。这些内容不仅可以帮助读者深入理解爬虫与反爬虫的技术细节，还可以帮助读者了解相关的法律法规，避免在爬取数据的过程中触犯法律。

推荐影视

阅读/下载地址

微信读书