强化学习(Reinforcement Learning)是人工智能的一个重要领域,是一个代表性的机器学习方法。它同时又和马尔可夫决策过程(Markov Decision Processes) 和动态规划(Dynamic Programming)紧密相关。这门课程内容主要包括线性与非线性规划、马尔可夫决策过程、最优控制和随机规划等。
课程视频链接:http://resource.pku.edu.cn/index.php?r=course/detail&id=303(点击“阅读全文”,进入课程视频链接)
(此课程视频版权属于讲授者,他人只能用作个人学习目的,不得用作商业相关用途。其他网站转载需要事先获得授权。)
继续阅读
阅读原文