专栏名称: 新智元
智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
今天看啥  ›  专栏  ›  新智元

【吐血整理】台湾大学李宏毅深度强化学习笔记(49PPT)

新智元  · 公众号  · AI  · 2018-07-17 09:47
  新智元推荐  来源:Medium作者:Ivan Lee【新智元导读】来自台湾超受欢迎的李宏毅老师深层强化学习49页PPT以及笔记,熬夜整理,值得收藏。本文授权转载自Medium,作者Ivan Lee。李宏毅老师通过下面的地球跟机器人比喻RL(Reinforcement Learning)过程是怎么回事。地球是环境(environment),代理(agent)用感测器去接收外接讯息,就像无人车在路上有六种以上装置感知外接讯息。外边感知到了一杯水,它(agent)感知到讯息接着采取行动,它把水打翻了。因他的改变而外界有所改变,一摊水洒在地上。接着外界(地球)给她了一个回馈:你刚刚的动作是不好的(Don't do that),所以机器人得到一个负面回馈。接着,机器人感测到地上有一滩水后,便采取行动——把地上水擦净,改变了 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照