注册登录

看啥推荐读物

专栏名称: 机器之心

专业的人工智能媒体和产业服务平台

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

知乎回答RSS订阅方法

知乎专栏 RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

新智元 · 你好，电动Atlas！波士顿动力机器人复活， ...· 昨天

爱可可-爱生活 · 通过理论分析和综合实验发现PPO经过精心微调 ...· 昨天

爱可可-爱生活 · 【Sequel: ...· 5 天前

爱可可-爱生活 · 【Reader：基于 Node.js ...· 5 天前

宝玉xp · //@演员邵逸凡:转发微博-20240414 ...· 5 天前

今天看啥 › 专栏 › 机器之心

大脑也在用分布式强化学习？DeepMind新研究登上《Nature》

机器之心 · 公众号 · AI · 2020-01-16 15:09

机器之心报道机器之心编辑部分布式强化学习是智能体在围棋、星际争霸等游戏中用到的技术，但 DeepMind 的一项研究表明，这种学习方式也为大脑中的奖励机制提供了一种新的解释，即大脑也应用了这种算法。这一发现验证了分布式强化学习的潜力，同时也使得 DeepMind 的研究人员越发坚信，「现在的 AI 研究正走在正确的道路上」。多巴胺是人们所熟悉的大脑快乐信号。如果事情的进展好于预期，大脑释放的多巴胺也会增多。在人脑中存在奖励路径，这些路径控制我们对愉悦事件的反应，并通过释放多巴胺的神经元进行介导。例如，在著名的巴布洛夫的狗实验中，当狗听到铃声便开始分泌口水时，这一反应并非已经获得了奖励，而是大脑中的多巴胺细胞对即将到来的 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博

推荐文章

新智元 · 你好，电动Atlas！波士顿动力机器人复活，180度诡异动作吓坏马斯克

昨天

爱可可-爱生活 · 通过理论分析和综合实验发现PPO经过精心微调可以优于DPO，在对-20240418052527

昨天

爱可可-爱生活 · 【Sequel: 开源的个性化健康助手，旨在帮助用户通过个性化的-20240414143148

5 天前

爱可可-爱生活 · 【Reader：基于 Node.js 的工具，可以将 URL 转-20240414120453

5 天前

宝玉xp · //@演员邵逸凡:转发微博-20240414073749

5 天前

科工力量 · 给俄“开后门”？土耳其被美欧盯上了

1 年前

军武次位面 · 一次能给2570辆汽车“加满油”的运油20，重要性不亚于轰20！

1 年前

青年文摘 · 真诚发问：为什么男朋友做什么都是错的？

2 年前

第一电动汽车网 · 6月电机排行榜：总配套量今年首破10万，特斯拉蝉联第一

3 年前

宋史研究资讯 · 包公文化传千载青天故里话传承 | 201912-74（总第1166期）

4 年前

关于移动版 · Py中国 · RSS之家 · codingpro · Code · link之家 · 卧龙AI搜索 · 藏经阁 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号