专栏名称: 专知
专知,为人工智能从业者服务,提供专业可信的人工智能知识与技术服务,让认知协作更快更好!
今天看啥  ›  专栏  ›  专知

【CMU博士论文】通过记忆的元强化学习

专知  · 公众号  ·  · 2021-10-16 17:00
尽管现代深度强化学习(RL)算法处于人工智能能力的前沿,但通常需要大量的训练样本才能达到与人类相当的性能水平。这种严重的数据效率低下是深度RL实际应用的主要障碍: 在没有模拟器的情况下,几乎不可能将深度RL应用到任何领域。为了解决这一关键的数据低效问题,在本文中,我们致力于设计能够快速适应新环境的元学习智能体。与标准的强化学习相比,元学习在环境分布上进行学习,从环境中抽样特定任务,并直接优化元学习者,以提高策略改进的速度。通过利用与感兴趣任务共享子结构的任务分布,元学习者可以调整自己的归纳偏差,从而在测试时快速适应。本文主要研究元学习算法的设计,该算法利用记忆作为驱动在新环境中快速适应的主要机制。情景



文章无法展示全部,请购买VIP后 使用网页访问内容 或者 使用第三方RSS订阅工具访问内容





今天看啥 - 让阅读更高品质
本文地址:http://www.jintiankansha.me/t/RUmhdMTJDz