AI简介
这是一本专注于自然语言处理领域深度学习技术的著作。本书共8章,主要介绍了自然语言处理任务中的深度学习技术,包含深度学习理论基础、深度学习的软件框架、语言模型与词向量、序列模型与梯度消失/爆炸、卷积神经网络在NLP领域的应用、Seq2Seq模型与Attention机制、大规模预训练模型、预训练语言模型BERT,还给出了自然语言处理技术的高级应用和开发实例,并收录了基于PyTorch深度学习框架的部分实践项目。
本书首先介绍了深度学习的历史与发展,从最初的MCP模型到反向传播算法,再到ReLU激活函数和AlphaGo的成功,深度学习已经逐渐变成一个让企业和学界都重视的工具,人工智能与工业互联网等领域势必成为未来科技发展的重要方向。
在深度学习的软件框架方面,本书详细讲解了PyTorch科学计算包,包括强大的GPU加速的张量(Tensor)计算以及包含自动求导系统的深度学习神经网络。
本书还详细介绍了语言模型定义与作用,词向量概念与重要性,以及序列模型定义与应用,包括RNN、LSTM和GRU等模型。
在解决梯度消失与爆炸方面,本书介绍了多种方法,如更换激活函数、批量归一化、使用Res