注册
登录
看啥推荐读物
专栏名称:
机器之心
专业的人工智能媒体和产业服务平台
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
知乎回答RSS订阅方法
知乎专栏 RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
新智元
·
你好,电动Atlas!波士顿动力机器人复活, ...
·
昨天
爱可可-爱生活
·
通过理论分析和综合实验发现PPO经过精心微调 ...
·
昨天
爱可可-爱生活
·
【Sequel: ...
·
5 天前
爱可可-爱生活
·
【Reader:基于 Node.js ...
·
5 天前
宝玉xp
·
//@演员邵逸凡:转发微博-20240414 ...
·
5 天前
今天看啥
›
专栏
›
机器之心
大脑也在用分布式强化学习?DeepMind新研究登上《Nature》
机器之心
·
公众号
·
AI
· 2020-01-16 15:09
机器之心报道机器之心编辑部分布式强化学习是智能体在围棋、星际争霸等游戏中用到的技术,但 DeepMind 的一项研究表明,这种学习方式也为大脑中的奖励机制提供了一种新的解释,即大脑也应用了这种算法。这一发现验证了分布式强化学习的潜力,同时也使得 DeepMind 的研究人员越发坚信,「现在的 AI 研究正走在正确的道路上」。多巴胺是人们所熟悉的大脑快乐信号。如果事情的进展好于预期,大脑释放的多巴胺也会增多。在人脑中存在奖励路径,这些路径控制我们对愉悦事件的反应,并通过释放多巴胺的神经元进行介导。例如,在著名的巴布洛夫的狗实验中,当狗听到铃声便开始分泌口水时,这一反应并非已经获得了奖励,而是大脑中的多巴胺细胞对即将到来的 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
分享到微博
推荐文章
新智元
·
你好,电动Atlas!波士顿动力机器人复活,180度诡异动作吓坏马斯克
昨天
爱可可-爱生活
·
通过理论分析和综合实验发现PPO经过精心微调可以优于DPO,在对-20240418052527
昨天
爱可可-爱生活
·
【Sequel: 开源的个性化健康助手,旨在帮助用户通过个性化的-20240414143148
5 天前
爱可可-爱生活
·
【Reader:基于 Node.js 的工具,可以将 URL 转-20240414120453
5 天前
宝玉xp
·
//@演员邵逸凡:转发微博-20240414073749
5 天前
科工力量
·
给俄“开后门”?土耳其被美欧盯上了
1 年前
军武次位面
·
一次能给2570辆汽车“加满油”的运油20,重要性不亚于轰20!
1 年前
青年文摘
·
真诚发问:为什么男朋友做什么都是错的?
2 年前
第一电动汽车网
·
6月电机排行榜:总配套量今年首破10万,特斯拉蝉联第一
3 年前
宋史研究资讯
·
包公文化传千载 青天故里话传承 | 201912-74(总第1166期)
4 年前