看啥推荐读物
专栏名称: 机器之心
专业的人工智能媒体和产业服务平台
今天看啥  ›  专栏  ›  机器之心

学界 | 价值传播网络,在更复杂的动态环境中进行规划的方法

机器之心  · 公众号  · AI  · 2018-06-21 12:24
选自arXiv机器之心编译参与:陈韵竹、张倩本文提出了一种基于价值迭代的参数高效差异化规划模块——价值传播网络(Value Propagation Networks),可以通过强化学习进行训练,用来完成未见过的任务。该模块能泛化到更大尺寸的地图中,并学习在动态环境中进行导航。此外,该模块能够在环境包含随机元素时学习进行规划,为各类交互式导航问题提供具有成本效益的学习系统,从而构建低级别、尺寸不变的规划器。1 引言规划是许多领域人工智能体的关键组成部分。然而,经典规划算法的局限性在于,对于每种可能的规划实例,人们都需要知道如何为其搜索最优(或至少合理的)方案。环境动态和状态复杂度的增加给规划的写作人员制造了困难,甚至使其完全不切实际 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照