内容简介
迁移学习作为机器学习和人工智能领域的重要方法,在计算机视觉、自然语言处理(NLP)、语音识别等领域都得到广泛应用。本书是迁移学习技术的实用入门图书,能够带领读者深入实践自然语言处理模型。首先,本书回顾了机器学习中的关键概念,并介绍了机器学习的发展历史,以及NLP迁移学习的进展;其次,深入探讨了一些重要的NLP迁移学习方法—NLP浅层迁移学习和NLP深度迁移学习;最后,涵盖NLP迁移学习领域中重要的子领域—以Transformer作为关键功能的深度迁移学习技术。读者可以动手将现有的先进模型应用于现实世界的应用程序,包括垃圾电子邮件分类器、IMDb电影评论情感分类器、自动事实检查器、问答系统和翻译系统等。 本书文字简洁、论述精辟、层次清晰,既适合拥有NLP基础的机器学习和数据科学相关的开发人员阅读,也适合作为高等院校计算机及相关专业的学生参考用书。
AI简介
这是一本深度探讨自然语言处理(NLP)领域迁移学习技术的实用入门图书。本书首先回顾了机器学习中的关键概念,并介绍了机器学习的发展历史,以及NLP迁移学习的进展。接着,深入探讨了一些重要的NLP迁移学习方法—NLP浅层迁移学习和NLP深度迁移学习。最后,涵盖NLP迁移学习领域中重要的子领域—以Transformer作为关键功能的深度迁移学习技术。
本书详细解析了垃圾电子邮件分类和电影评论情感分类这两个典型问题。这两个问题都涉及到对文本数据的分类,但它们的目标和实现方式有所不同。在处理这些数据时,我们首先需要获取对应的数据,并进行预处理。在构建模型时,我们主要使用广义线性模型,包括逻辑斯谛回归和带有线性核的SVM。
书中还详细介绍了预训练词嵌入在NLP中的应用,主要指的是通过预训练的方式,为自然语言处理中的单词生成一组实数向量,这组向量能够捕捉单词的语义信息。预训练词嵌入技术起源于20世纪60年代的信息检索的词元向量模型,并在21世纪10年代中期达到了顶峰,出现了多种变体,如CBOW和Skip-Gram。
此外,本书还深入探讨了多任务学习在NLP中的应用,主要指的是在训练一个模型时,