注册登录

看啥推荐读物

专栏名称: 数据派THU

本订阅号是“THU数据派”的姊妹账号，致力于传播大数据价值、培养数据思维。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

知乎回答RSS订阅方法

知乎专栏 RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

大数据文摘 · 字节跳动发布豆包大模型，主力模型比行业价格低 ...· 3 天前

数据派THU · 【ICML2024】双曲几何潜在扩散模型用于图生成· 2 天前

大数据文摘 · 在 ICLR 2024，看见中国大模型的力量· 5 天前

数据派THU · ICLR 2024 | ...· 4 天前

数据派THU · LeCun哈佛演讲PPT放出：唱衰自回归LL ...· 4 天前

今天看啥 › 专栏 › 数据派THU

独家 | 使用Python的OpenAI Gym对Deep Q-Learning的实操介绍（附学习资源）

数据派THU · 公众号 · 大数据 · 2019-05-17 19:00

作者：ANKIT CHOUDHARY翻译：张睿毅校对：吴金笛本文4300字，建议阅读10+分钟。本文作者通过实战介绍了Deep Q-Learning的概念。导言我一直对游戏着迷。在紧凑的时间线下执行一个动作似乎有无限的选择——这是一个令人兴奋的体验。没有什么比这更好的了。所以当我读到DeepMind提出的不可思议的算法（如AlphaGo和AlphaStar）时，我被吸引了。我想学习如何在我自己的机器上制造这些系统。这让我进入了深度强化学习（Deep RL）的世界。即使你不喜欢玩游戏，深度强化学习也很重要。只用看当前使用深度强化学习进行研究的各种功能就知道了：那工业级应用程序呢？这里有两个最常见的深度强化学习用例：谷歌云自动机器学习(Google’s Cloud AutoML)脸书Horizon平台(Facebook's Horizon Platfor ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博

推荐文章

大数据文摘 · 字节跳动发布豆包大模型，主力模型比行业价格低99.3%

3 天前

数据派THU · 【ICML2024】双曲几何潜在扩散模型用于图生成

2 天前

大数据文摘 · 在 ICLR 2024，看见中国大模型的力量

5 天前

数据派THU · ICLR 2024 | 跨领域准确进行零样本异常检测，浙大等提出AnomalyCLIP

4 天前

数据派THU · LeCun哈佛演讲PPT放出：唱衰自回归LLM，指明下一代AI方向

4 天前

但斌 · 又有33000瓶飞天茅台将在商超投放 ////// 第三方视角看-20230112235137

1 年前

安康交通广播 · 西安恢复正常出行，无需离市证明！城南客运站恢复运营！【959热点】

2 年前

第一财经YiMagazine · 周末今晨发生了什么？ |YiMagazine

3 年前

楼市科学家 · 直播预告：双限政策对于南京楼市到底有什么影响？

3 年前

人工智能那点事 · 任正非：华为今年研发预算超200亿美元

4 年前

关于移动版 · Py中国 · RSS之家 · codingpro · Code · link之家 · 卧龙AI搜索 · 藏经阁 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号