深度强化学习算法与实践:基于PyTorch的实现

深度强化学习算法与实践:基于PyTorch的实现

评分

★★★★★

ISBN

9787121429729

出版社

电子工业出版社 2022-04-01出版

作者

张校捷

分类

编程设计

内容简介
本书从强化学习的基础知识出发,结合PyTorch深度学习框架,介绍深度强化学习算法各种模型的相关算法原理和基于PyTorch的代码实现。作为一本介绍深度强化学习知识的相关图书,本书介绍了常用的强化学习环境,基于价值网络的强化学习算法和基于策略梯度的强化学习算法,以及一些常用的比较流行的深度强化学习算法(如蒙特卡洛树搜索)等。另外,还介绍了深度强化学习算法在实际问题中的一些应用。
AI简介
这是一本以深度强化学习为核心,详细介绍了强化学习基本概念与理论、强化学习环境、深度强化学习算法原理与实现的书籍。本书基于PyTorch深度学习框架,以深入浅出的方式介绍了深度强化学习算法,包括强化学习基本概念与理论、强化学习环境的分类、蒙特卡洛树搜索算法原理与实现等。 本书首先介绍了强化学习基本概念与理论,包括强化学习的历史、基本概念、算法分类、深度强化学习基本概念、优缺点、蒙特卡洛梯度估计等。接着,本书介绍了强化学习环境,包括简单的强化学习环境、OpenAI Gym环境、DeepMind Lab强化学习环境等。此外,本书还详细介绍了深度Q函数强化学习算法,包括经典深度Q网络算法(DQN)、双网络Q学习算法(Double Q-Learning)、优先经验回放(Prioritized Experience Replay)等。 本书还详细介绍了策略梯度强化学习算法,包括经典策略梯度算法(VPG)、优势演员-评论家算法(A2C和A3C)、置信区间策略优化算法等。此外,本书还介绍了其他强化学习算法,包括噪声网络(Noisy Networks)、深度确定性策略梯度算法(DDPG)、双延迟深度
阅读/下载地址