课程网址:https://www.xuetangx.com/course/fdu0809bt2074/26291019?channel=i.area.manual_search
课程介绍
课程从强化学习的基本概念谈起,介绍了重要的Bellman方程。然后介绍经典的时序差分、SARSA、Q-Learning、深度Q网络、Double DQN、Actor-critic、Policy Gradient、A2C以及A3C、TRPO、PPO等常用的深度强化学习算法。此外,还通过典型的案例分析,以及腾讯开悟平台对上述算法进行实验,方便理解,动手实践。