精通Transformer：从零开始构建最先进的NLP模型-萨瓦斯·伊尔蒂利姆|江红|余青松|余靖|免费在线阅读|编程设计|北京理工大学出版社

内容简介

AI领域的基石王者,那些还沉迷于CNN，RNN的工程师被警告：放弃战斗吧，向Transformer投降！在过去的二十年中，自然语言处理研究领域发生了翻天覆地的变化。在这段时间里，自然语言处理经历了不同的处理范式，并最终进入了一个由神奇的Transformer体系结构主导的新时代。 Transformer深度学习架构是通过继承许多方法而产生的，其中包括上下文词嵌入、多头注意力机制、位置编码、并行体系结构、模型压缩、迁移学习、跨语言模型等。在各种基于神经的自然语言处理方法中， Transformer架构逐渐演变为基于注意力的“编码器-解码器”体系结构，并持续发展到今天。现在，我们在文献中看到了这种体系结构的新的成功变体。目前研究已经发现了只使用 Transformer 架构中编码器部分的出色模型，如 BERT(Bidirectional Encoder Representations from Transformers,Transformers双向编码表示);或者只使用Transformer架构中解码器部分的出色模型，如 GPT(Generated Pre -trained Tran

AI简介

这是一本专注于自然语言处理(NLP)领域中的Transformer模型的专业书籍。书中详细介绍了Transformer模型的发展历程、安装环境、使用方法以及高级主题，为读者提供了一站式学习Transformer模型的机会。首先，本书从自然语言处理的发展历程入手，介绍了Transformer模型如何从词袋模型到Transformer模型的变革。接着，作者详细讲解了安装Transformer环境的步骤，包括TensorFlow、PyTorch和Transformer的安装，以及使用Google Colab安装环境的方法。此外，书中还介绍了如何使用语言模型和分词器，以及如何原生PyTorch训练分类模型。在高级主题部分，作者深入探讨了高效Transformer模型概述，包括Transformer模型在自然语言处理领域的应用和优化。此外，还介绍了问题回答系统实现，以及如何利用FastAPI框架和pydantic定义数据类进行实现。在模型规模缩减方面，作者讲解了模型规模缩减的实现方法，包括提炼、剪枝和量化技术。此外，书中还详细介绍了XLNet模型的独特性，以及如何使用探测分类器与BE

推荐影视

阅读/下载地址

微信读书