INSTANT Jsoup How-to

INSTANT Jsoup How-to

评分

★★★★★

ISBN

9781782168003

出版社

Packt Publishing 2013-06-07出版

作者

Pete Houston

分类

编程设计

内容简介
Filled with practical, step-by-step instructions and clear explanations for the most important and useful tasks. This book will take a how-to approach, focusing on recipes that demonstrate Jsoup.If you are working in data scraping, data crawling, or within a similar area using Java, then this book is the one for you. This book acts as a fast-paced and simple guide to enhance your HTML data manipulating skills using one of the most well-known libraries, Jsoup.
AI简介
这是一本专注于介绍Jsoup工具的书籍,通过实用的步骤和清晰的解释,向读者展示了如何使用Jsoup完成各种HTML数据操作任务。本书主要关注于HTML解析框架,它是由James Graham开发的,主要用于提取和转换HTML内容。Jsoup的强大之处在于,它能够解析各种复杂的HTML结构,包括嵌套的标签、属性、文本等,并且能够准确地提取出所需的信息。 在本书中,作者详细介绍了如何使用Jsoup处理本地文件、字符串和URI中的HTML数据。此外,还详细介绍了如何使用CSS选择器通过特定规则匹配HTML元素,以及如何清洗HTML文档,去除HTML中的不安全因素,保护用户的浏览体验。 书中还详细介绍了如何遍历DOM树提取数据,以及如何解析网页链接。此外,还介绍了如何配置连接超时,设置用户代理,处理不同内容类型,添加请求参数,设置输出格式和配置解析器类型等。
阅读/下载地址