注册登录

看啥推荐读物

专栏名称: 人工智能学家

致力成为权威的人工智能科技媒体和前沿科技研究机构

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

知乎回答RSS订阅方法

知乎专栏 RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

宝玉xp · 转发微博-20240529011318· 2 天前

爱可可-爱生活 · 【ComfyUI提示样式器：为ComfyUI ...· 2 天前

量子位 · Hinton揭秘Ilya成长历程：Scali ...· 4 天前

宝玉xp · //@王龙跃_Vincent:感谢量子位对我 ...· 5 天前

宝玉xp · //@明风:@我的印象笔记//@藏玉匿瑕:厉 ...· 5 天前

今天看啥 › 专栏 › 人工智能学家

Google发布“多巴胺”开源强化学习框架，三大特性全满足

人工智能学家 · 公众号 · AI · 2018-08-28 21:39

编译整理 | Just编辑 | 阿司匹林来源：AI科技大本营强化学习是一种非常重要 AI 技术，它能使用奖励（或惩罚）来驱动智能体（agents）朝着特定目标前进，比如它训练的 AI 系统 AlphaGo 击败了顶尖围棋选手，它也是 DeepMind 的深度 Q 网络（DQN）的核心部分，它可以在多个 workers 之间分步学习，例如，在 Atari 2600 游戏中实现“超人”性能。麻烦的是，强化学习框架需要花费大量时间来掌握一个目标，而且框架往往是不灵活和不总是稳定的。但不用担心，Google 近日发布了一个替代方案：基于 TensorFlow 的开源强化学习框架 Dopamine（多巴胺）。 Google 的博文中提到，这个基于 Tensorflow 的强化学习框架，旨在为 RL 的研究人员提供灵活性，稳定性和可重复性的研究。受到大脑中奖 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博

推荐文章

宝玉xp · 转发微博-20240529011318

2 天前

爱可可-爱生活 · 【ComfyUI提示样式器：为ComfyUI定制的提示样式化工具-20240528141124

2 天前

量子位 · Hinton揭秘Ilya成长历程：Scaling Law是他学生时代就有的直觉

4 天前

宝玉xp · //@王龙跃_Vincent:感谢量子位对我们TransAgen-20240526013538

5 天前

宝玉xp · //@明风:@我的印象笔记//@藏玉匿瑕:厉害👍🏻-20240526020322

5 天前

新洞察 · 看来，有人要发财了！

6 月前

砂石观察家 · 【砂石需求】总投资约3800亿元！全国多地多条铁路项目预开工！

9 月前

洁净工程联盟 · 中国液冷数据中心市场发展研究

3 年前

UCloud云安全 · 高防服务器和高防IP的关系

4 年前

乐趣微生活 · 地铁美女，太暴躁【NO4】

6 年前

关于移动版 · Py中国 · RSS之家 · codingpro · Code · link之家 · 卧龙AI搜索 · 藏经阁 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号