AI简介
这是一本以深度强化学习为核心,详细介绍了强化学习基本概念与理论、强化学习环境、深度强化学习算法原理与实现的书籍。本书基于PyTorch深度学习框架,以深入浅出的方式介绍了深度强化学习算法,包括强化学习基本概念与理论、强化学习环境的分类、蒙特卡洛树搜索算法原理与实现等。
本书首先介绍了强化学习基本概念与理论,包括强化学习的历史、基本概念、算法分类、深度强化学习基本概念、优缺点、蒙特卡洛梯度估计等。接着,本书介绍了强化学习环境,包括简单的强化学习环境、OpenAI Gym环境、DeepMind Lab强化学习环境等。此外,本书还详细介绍了深度Q函数强化学习算法,包括经典深度Q网络算法(DQN)、双网络Q学习算法(Double Q-Learning)、优先经验回放(Prioritized Experience Replay)等。
本书还详细介绍了策略梯度强化学习算法,包括经典策略梯度算法(VPG)、优势演员-评论家算法(A2C和A3C)、置信区间策略优化算法等。此外,本书还介绍了其他强化学习算法,包括噪声网络(Noisy Networks)、深度确定性策略梯度算法(DDPG)、双延迟深度