ICLR 2018 | Oral论文：zero-shot视觉模仿系统GSP，仅观察演示就学会执行任务

机器之心 · 公众号 · AI · 2018-04-30 13:06

选自arxiv作者：Deepak Pathak机器之心编译参与：Nurhachu Null、刘晓坤ICLR 2018将于今晚正式开始，机器之心带你抢先一睹这篇来自UC Berkeley的Oral论文。目前模仿学习依赖于专家监督来学习模仿什么以及如何模仿。作者寻求可替代的范式，其中智能体只需知道要模仿什么，然后自主学习如何模仿。该方法是 zero-shot 的，因为在训练或者推理任务演示的时候，智能体从未接触专家如何执行任务的信息。研究者在两个实际环境中测试了该 zero-shot 方法：分别是使用 Baxter 机器人的复杂绳索操作和使用 TurtleBot 机器人的陌生环境室内导航。在 VizDoom 环境模仿的进一步实验中，给出了这样的证据：更好的探索机制可以导致更强大的策略，策略反过来又进一步提升最终的任务性能。Baxt ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博