专栏名称: 机器之心
专业的人工智能媒体和产业服务平台
今天看啥  ›  专栏  ›  机器之心

效率提高50倍!谷歌提出从图像中学习世界的强化学习新方法

机器之心  · 公众号  · AI  · 2019-02-16 12:13
选自Google AI Blog作者:Danijar Hafner机器之心编译机器之心编辑部近日,谷歌 AI 和 DeepMind 合作创建了深度规划网络(PlaNet)智能体,仅基于图像输入就能学习世界模型,并利用该模型规划未来。与谷歌一年前提出的世界模型相比,PlaNet 的运行不需要策略网络,它对动作的选择仅依靠规划。此外,它在多项任务上的性能可媲美无模型方法,但平均数据效率是后者的 50 倍。关于人工智能体如何随时间推移提升自己决策的研究正借助强化学习(RL)取得快速进展。在这项技术中,智能体在选择动作(如运动指令)时观察一系列感官输入(如相片),有时会因为达到某个特定目标而得到奖励。RL 无模型方法旨在从感官观察结果中直接预测良好的动作,使得 DeepMind 的 DQN 可以玩 Ata ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照