注册登录

看啥推荐读物

专栏名称: 人工智能学家

致力成为权威的人工智能科技媒体和前沿科技研究机构

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

知乎回答RSS订阅方法

知乎专栏 RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

爱可可-爱生活 · 【LLM ...· 昨天

爱可可-爱生活 · 今日推介(第1407期)：触觉丰富操作的视听 ...· 昨天

爱可可-爱生活 · 【PaliGemma：谷歌发布的最新视觉语言 ...· 2 天前

宝玉xp · 回复@smart_tiger请问我今天写论文 ...· 4 天前

黄建同学 · AI产品榜，aicpb.com#ai# ...· 6 天前

今天看啥 › 专栏 › 人工智能学家

DeepMind推出分布式深度强化学习架构IMPALA，让一个Agent学会多种技能

人工智能学家 · 公众号 · AI · 2018-02-08 18:01

维金编译自 DeepMind Blog量子位出品 | 公众号 QbitAI目前，深度增强学习（DeepRL）技术在多种任务中都大获成功，无论是机器人的持续控制问题，还是掌握围棋和雅达利的电子游戏。不过，这些方面的进展仅限于孤立任务。完成每一项任务都要单独调试、训练agent。在最近的工作中，我们研究了如何训练单一agent去执行多种任务。今天，我们发布了DMLab-30。这是一组新任务，包含了在统一视觉环境、通用动作空间（action space）中的多种类型挑战。训练agent去胜任多种任务意味着巨大的吞吐量，以及要高效地利用每个数据点。为此，我们开发了全新的、扩展性强的agent架构，用于分布式训练。这就是IMPALA（重要性加权的操作者-学习者架构，Importances Weighted Actor-Learner Archite ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博

推荐文章

爱可可-爱生活 · 【LLM Comparator：用于并排评估和分析大型语言模型(-20240516200008

昨天

爱可可-爱生活 · 今日推介(第1407期)：触觉丰富操作的视听预训练、理解在线和离-20240516062438

昨天

爱可可-爱生活 · 【PaliGemma：谷歌发布的最新视觉语言模型，结合了图像编码-20240515080541

2 天前

宝玉xp · 回复@smart_tiger请问我今天写论文没:翻译确实做的不错-20240513040902

4 天前

黄建同学 · AI产品榜，aicpb.com#ai# 4月份的榜单截了一部分↓-20240511174255

6 天前

南京有个号 · 接近250万人参保的江苏医惠保有用吗？有人用亲身经历现身说法了

2 年前

生物学霸 · 日测 10 万人！「魔剪之父」张锋再发新冠检测新技术

4 年前

中国金融四十人论坛 · 马云十大经典金句

4 年前

泰安钱币收藏 · 七夕到了，致我最爱的人！

4 年前

上海发布 · 【提示】公积金账户信息可在中行自助机查询！

7 年前

关于移动版 · Py中国 · RSS之家 · codingpro · Code · link之家 · 卧龙AI搜索 · 藏经阁 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号