专栏名称: PaperWeekly
PaperWeekly是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台,致力于让国内外优秀科研工作得到更为广泛的传播和认可。社区:http://paperweek.ly | 微博:@PaperWeekly
目录
今天看啥  ›  专栏  ›  PaperWeekly

David Silver深度强化学习课程 - 中文字幕 | 共同学习 #10

PaperWeekly  · 公众号  · 科研  · 2017-05-03 12:32
    

文章预览

David Silver 博士是 AlphaGo 的最主要研发人员。众所周知,AlphaGo 是第一个战胜人类顶级围棋高手的计算机围棋程序。AlphaGo 底层核心技术包括深度学习(deep learning)、强化学习(reinforcement learning),和蒙特卡洛搜索树(Monte Carlo tree search)。  在这门强化学习的课程中,Silver 博士从简介、马尔科夫决策过程(Markov Decision Processes)、免模型预测(Model-free Prediction)、免模型控制(Model-free Control)、值函数近似(Value Function Approximation)、策略梯度算法(Policy Gradient)、集成学习和计划(Integrating Learning and Planning)、探索与利用(Exploration and Exploitation)、游戏等方面深入浅出地介绍强化学习。课程中也涉及最近的热点:深度强化学习。 本周我们继续 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览