看啥推荐读物
专栏名称: 机器之心
专业的人工智能媒体和产业服务平台
今天看啥  ›  专栏  ›  机器之心

ICLR 2018 | Oral论文:zero-shot视觉模仿系统GSP,仅观察演示就学会执行任务

机器之心  · 公众号  · AI  · 2018-04-30 13:06
选自arxiv作者:Deepak Pathak机器之心编译参与:Nurhachu Null、刘晓坤ICLR 2018将于今晚正式开始,机器之心带你抢先一睹这篇来自UC Berkeley的Oral论文。目前模仿学习依赖于专家监督来学习模仿什么以及如何模仿。作者寻求可替代的范式,其中智能体只需知道要模仿什么,然后自主学习如何模仿。该方法是 zero-shot 的,因为在训练或者推理任务演示的时候,智能体从未接触专家如何执行任务的信息。研究者在两个实际环境中测试了该 zero-shot 方法:分别是使用 Baxter 机器人的复杂绳索操作和使用 TurtleBot 机器人的陌生环境室内导航。在 VizDoom 环境模仿的进一步实验中,给出了这样的证据:更好的探索机制可以导致更强大的策略,策略反过来又进一步提升最终的任务性能。Baxt ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照