注册登录

看啥推荐读物

专栏名称: AI科技评论

点评学术，服务 AI ！

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

知乎回答RSS订阅方法

知乎专栏 RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

人民网舆情数据中心 · 校方回应学生请5天丧假只批3天、西北大学博士 ...· 昨天

人民网舆情数据中心 · 安徽铜陵居民楼坍塌致4人遇难、茉酸奶就门店使 ...· 3 天前

人民网舆情数据中心 · “打工人嘴替”王妈塌房 ...· 2 天前

人民网舆情数据中心 · 从人声鼎沸到重归平静 ...· 4 天前

人民网舆情数据中心 · 第七届数字中国建设峰会在福州举办、国家数据局 ...· 4 天前

今天看啥 › 专栏 › AI科技评论

DeepMind强化学习新研究：更快的知识学习，更强的环境适应

AI科技评论 · 公众号 · · 2021-05-04 11:27

编译 | Mr Bear 校对 | 维克多DeepMind官方博客在一篇文章“Fast reinforcement learning through the composition of behaviours”中，针对强化学习中的“从头学习”问题给予了解决方案。文章中表示，人类处理一些新任务时候，例如做菜，往往能够利用之前学过的知识、技能。而强化学习中的智能体往往需要从头学习。针对上述挑战，DeepMind的研究员们采用了一种名为“后继特征”特征的方案，其效果是：智能体可以将一个问题分解为更小的、更易于管理的子任务，而不是将其作为一个单一的、整体的任务来处理。研究员在博客中表示，其能够提供了一种学习灵活解决问题的新方法，能够赋予 RL 智能体利用从之前的任务中学到的知识的能力。以下是原文，AI科技评论做了不改变原意的编译 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博

推荐文章

人民网舆情数据中心 · 校方回应学生请5天丧假只批3天、西北大学博士招生被质疑存在问题丨一览众云•数递舆情（5.30日报）

昨天

人民网舆情数据中心 · 安徽铜陵居民楼坍塌致4人遇难、茉酸奶就门店使用过期原料致歉丨一览众云•数递舆情（5.28日报）

3 天前

人民网舆情数据中心 · “打工人嘴替”王妈塌房如何读懂热搜话题背后的舆论关切

2 天前

人民网舆情数据中心 · 从人声鼎沸到重归平静菏泽南站如何应对“泼天流量”

4 天前

人民网舆情数据中心 · 第七届数字中国建设峰会在福州举办、国家数据局印发《数字中国建设2024年工作要点清单》｜一周新媒体观察

4 天前

新闻株洲 · 制造名城进北大！

7 月前

社会学了没 · 小众高薪：超适合女生的小众高薪副业，600-800元/篇，有模板参考，简单好做

2 年前

央视财经 · 燃料电池传来大消息！成本大降60%！各大车企纷纷布局！又一个万亿风口来了？

2 年前

码农学习联盟 · 比特币又暴跌！16位币圈大V被封号，马斯克也惨遭黑客威胁。。

2 年前

i黑马 · 34位顶级产品人，邀你抱团干票大的！

6 年前

关于移动版 · Py中国 · RSS之家 · codingpro · Code · link之家 · 卧龙AI搜索 · 藏经阁 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号