NLTK基础教程:用NLTK和Python库构建机器学习应用

NLTK基础教程:用NLTK和Python库构建机器学习应用

评分

★★★★★

ISBN

9787115452573

出版社

人民邮电出版社 2017-06-01出版

译者

凌杰

分类

编程设计

内容简介
NLTK库是当前自然语言处理(NLP)领域zui为流行、使用zui为广泛的库之一,同时Python语言经过一段时间的发展也已逐渐成为主流的编程语言之一。本书主要介绍如何通过NLTK库与一些Python库的结合从而实现复杂的NLP任务和机器学习应用。
AI简介
这是一本专注于自然语言处理(NLP)和机器学习应用的综合性教材。本书通过详细的目录和简介,向读者展示了如何通过NLTK库和Python语言实现复杂的NLP任务和机器学习应用。书中涵盖了文本歧义、词性标注、文本结构解析等基础概念,同时也介绍了如何使用NLTK库进行文本分类、Web爬虫、社交媒体挖掘以及大规模文本挖掘等高级应用。 本书强调了文本预处理的重要性,包括数据再加工、文本清理、特定预处理、标识化处理、词干提取或词形还原以及停用词移除等步骤。这些步骤对于提高文本的质量,减少噪声,并使其更适合用于特定的任务至关重要。 在词性标注方面,书中详细介绍了词性标注的定义和重要性,并介绍了如何使用NLTK库进行词性标注。同时,本书还介绍了命名实体识别(NER) 的方法与实现,包括使用预先训练好的NER模型和建立一个机器学习基本模型。 在文本结构解析方面,书中介绍了浅解析与深解析的区别,并介绍了如何使用NLTK库进行文本结构解析。此外,本书还介绍了依存性文本解析和语块分解的概念和实现方法。 在NLP应用方面,书中介绍了如何构建第一个NLP应用,并介绍了其他NLP应用,如情感分析、垃圾邮件分
阅读/下载地址