自AlphaGo横空出世后,强化学习,特别是深度强化学习受到了越来越多人的关注。除强化学习本领域外,深度强化学习也开始作为一种新的工具在其他的研究领域(如NLP)内开始发挥自己的力量。了解并实现一些经典的深度强化学习算法,已经成了了解某些研究方向最新进展的基本需要。
由 UC Berkeley 大学开设的 CS 294-112 Deep Reinforcement Learning 就是全面介绍深度强化学习基础的一们很好的课程。本课程同时配有课件、课程录像以及编程作业,是学习强化学习算法很好的资源。
介于 CS 294 中编程作业的官方下发代码多由 TensorFlow 实现,这在一定程度上增加了使用这些作业的前置要求。因此,我们用 PyTorch 将编程作业的部分代码重新实现,并且发布到了 GItHub 上供大家使用。
我们的代码基于 CS 294 最新一季(Fall 2018)的编程作业,目前已经完成了以下部分的工作:
项目地址:KuNyaa/berkeleydeeprlcourse-homework-pytorch
同时,我们也提供了我们自己写的解答:KuNyaa/berkeleydeeprlcourse-homework-pytorch-solution
欢迎star~
同时有任何问题也欢迎指出~