看啥推荐读物
专栏名称: 人工智能学家
致力成为权威的人工智能科技媒体和前沿科技研究机构
今天看啥  ›  专栏  ›  人工智能学家

DeepMind推出分布式深度强化学习架构IMPALA,让一个Agent学会多种技能

人工智能学家  · 公众号  · AI  · 2018-02-08 18:01
维金 编译自 DeepMind Blog量子位 出品 | 公众号 QbitAI目前,深度增强学习(DeepRL)技术在多种任务中都大获成功,无论是机器人的持续控制问题,还是掌握围棋和雅达利的电子游戏。不过,这些方面的进展仅限于孤立任务。完成每一项任务都要单独调试、训练agent。在最近的工作中,我们研究了如何训练单一agent去执行多种任务。今天,我们发布了DMLab-30。这是一组新任务,包含了在统一视觉环境、通用动作空间(action space)中的多种类型挑战。训练agent去胜任多种任务意味着巨大的吞吐量,以及要高效地利用每个数据点。为此,我们开发了全新的、扩展性强的agent架构,用于分布式训练。这就是IMPALA(重要性加权的操作者-学习者架构,Importances Weighted Actor-Learner Archite ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照