内容简介:

强化学习(Reinforcement Learning)是人工智能的一个重要领域,是一个代表性的机器学习方法。它同时又和马尔可夫决策过程(Markov Decision Processes) 和动态规划(Dynamic Programming)紧密相关。这门课程内容主要包括线性与非线性规划、马尔可夫决策过程、最优控制和随机规划等。

此课程视频版权属于讲授者,他人只能用作个人学习目的,不得用作商业相关用途。其他网站转载需要事先获得授权。所讲授内容有不准确或不正确的,敬请能谅解!

课程目录