附件:设置1:设置2:设置3:本书首先介绍了强化学习的基本原理, 然后介绍典型的强化学习算法, 包括时序差分、SARSA、Q-Learning、Deep Q-network、Double DQN、竞争网络结构、Rainbow、Actor-Critic、A2C、A3C、TRPO和PPO等, 每种算法基本上利用了主流的开源机器学习框架TensorFlow, 使用Python编程进行实现。此外, 还介绍了一些上述算法的应用。摘要:
附注提要
本书首先介绍了强化学习的基本原理, 然后介绍典型的强化学习算法, 包括时序差分、SARSA、Q-Learning、Deep Q-network、Double DQN、竞争网络结构、Rainbow、Actor-Critic、A2C、A3C、TRPO和PPO等, 每种算法基本上利用了主流的开源机器学习框架TensorFlow, 使用Python编程进行实现。此外, 还介绍了一些上述算法的应用。