看啥推荐读物
专栏名称: 数据派THU
本订阅号是“THU数据派”的姊妹账号,致力于传播大数据价值、培养数据思维。
今天看啥  ›  专栏  ›  数据派THU

独家 | 使用Python的OpenAI Gym对Deep Q-Learning的实操介绍(附学习资源)

数据派THU  · 公众号  · 大数据  · 2019-05-17 19:00
作者:ANKIT CHOUDHARY翻译:张睿毅校对:吴金笛本文4300字,建议阅读10+分钟。本文作者通过实战介绍了Deep Q-Learning的概念。导言我一直对游戏着迷。在紧凑的时间线下执行一个动作似乎有无限的选择——这是一个令人兴奋的体验。没有什么比这更好的了。所以当我读到DeepMind提出的不可思议的算法(如AlphaGo和AlphaStar)时,我被吸引了。我想学习如何在我自己的机器上制造这些系统。这让我进入了深度强化学习(Deep RL)的世界。即使你不喜欢玩游戏,深度强化学习也很重要。只用看当前使用深度强化学习进行研究的各种功能就知道了:那工业级应用程序呢?这里有两个最常见的深度强化学习用例:谷歌云自动机器学习(Google’s Cloud AutoML)脸书Horizon平台(Facebook's Horizon Platfor ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照