今天看啥  ›  专栏  ›  AI开发者

利用好奇心做稀疏反馈任务的学习

AI开发者  · 公众号  · AI  · 2018-07-23 08:00
AI 研习社按:近期,Unity 发布了版本 0.4 的机器学习智能体工具包(ML-Agent toolkit v0.4),其中最为突出的新功能是通过额外的基于好奇心的内在激励进行智能体的训练。由于这个新功能在解释时有很多方面需要解开,作者 Arthur Juliani 独立编写了一篇文章进行描述。AI 研习社把这篇文章编译如下。在原理上,如果奖励出现的几率不高或稀疏的分布情况下,现在是有更有效的方式让智能体进行环境感知的。这些智能体可以通过使用一种基于对结果好奇的程度进行奖励的方式对这样的环境进行探索。在这篇文章中,作者讲述了这种方式的工作原理并且展现了如何通过使用这种方式解决一个实际的任务,同时与原始版本的强化学习方法进行对比,表现出了这种新方法的优越性 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照