专栏名称: AI开发者
AI研习社,雷锋网旗下关注AI开发技巧及技术教程订阅号。
今天看啥  ›  专栏  ›  AI开发者

深度强化学习从入门到大师:以刺猬索尼克游戏为例讲解PPO(第六部分)

AI开发者  · 公众号  · AI  · 2019-01-15 18:27
本文为 AI 研习社编译的技术博客,原标题 :Proximal Policy Optimization (PPO) with Sonic the Hedgehog 2 and 3作者 | Thomas Simonini翻译 | 安石徒            校对 | 斯蒂芬•二狗子审核 | 邓普斯•杰弗    整理 | 菠萝妹原文链接:https://towardsdatascience.com/proximal-policy-optimization-ppo-with-sonic-the-hedgehog-2-and-3-c9c21dbed5e注:本文的相关链接请点击文末【阅读原文】进行访问深度强化学习从入门到大师:以刺猬索尼克游戏为例讲解PPO(第六部分)几周前,OpenAI在深度强化学习上取得了突破性进展。由5个智能体的组成的人工智能团队OpenAI five击败了现实中的DOTA2玩家。但遗憾的是,该人工智能团队输掉了随后的第二场比赛。Dota2这个突破性进展的取得得益于强大的硬件支持和 PPO 算法(近端策略 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照