短文本数据理解

短文本数据理解

评分

★★★★★

ISBN

9787111558811

出版社

机械工业出版社 2017-02-01出版

作者

王仲远

分类

数据库

内容简介
短文本理解是伴随着搜索引擎、社交网络及聊天机器人等应用场景而兴起的一个研究课题。它是近些年的一个研究热点,且对未来人工智能的发展有重要的影响。由于短文本字词少、歧义大、不遵守语法规则等特点,传统自然语言处理技术如句法分析器等难以直接应用于短文本。因此,研究人员不得不另辟蹊径来解决机器理解短文本的问题。
AI简介
这是一本深入探讨短文本数据理解技术的著作,详细阐述了短文本数据理解的模型粒度分析,基于概率的属性提取与推导,以及基本层次类别在人工智能中的作用等关键内容。这本书强调了传统知识库系统在短文本理解中的局限性,并指出,为了更好地理解短文本,我们需要从文本中提取出实体和概念的相关属性,并通过概率模型对这些属性进行量化和推导。 书中详细介绍了短文本理解框架,包括短文本理解,基于概率的属性提取与推导,单实体概念化模型,基于概念化的短文本理解,基于概念化的短文本主题词与修饰词检测,基于概念化的词相似度计算,以及基于概念化的海量竞价关键字匹配等内容。这些框架为短文本理解提供了理论支持和实践指导。 在书中,作者详细阐述了基本层次类别在人工智能中的作用,指出基本层次类别是人类理解世界的一种基本方式,它通过将新事物归类到已知类别中,帮助我们快速理解并处理大量的信息。此外,作者还介绍了人类理解世界的基本层次类别的感知相似性,以及基本层次类别的感知相似性在知识面板、广告及推荐系统中的应用。 在短文本理解研究展望部分,作者提出了将文本转化为机器可以获取其含义的编码形式的重要性,并探讨了如何挖掘文本数据中的隐
阅读/下载地址