注册登录

看啥推荐读物

专栏名称: OSC开源社区

OSChina 开源中国官方微信账号

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

知乎回答RSS订阅方法

知乎专栏 RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

程序猿 · 支付宝大楼换上新Logo：无比简洁；马化腾周 ...· 昨天

程序猿 · 危！比 Python 快 90,000 ...· 昨天

程序猿 · 世界上最好的编程语言——PHP排名跌至历史最低· 4 天前

OSC开源社区 · 今天面试写了这段代码，能被录取吗？· 3 天前

OSC开源社区 · Go语言之父反思错误：“并发”理念指导不足、 ...· 5 天前

今天看啥 › 专栏 › OSC开源社区

yyds！用深度学习框架玩明日方舟，高端！

OSC开源社区 · 公众号 · 程序员 · 2021-04-17 11:43

喜欢就关注我们吧！每个游戏玩家都有一个梦，希望自己在虚拟世界中成为万众瞩目、无所不能的英雄。然后…然后…闹钟响了梦醒了，又到了挤地铁上班的时间。不过，在这个项目中，我将带大家暂时忘却现实的烦恼，用飞桨深度强化学习框架PARL来实现这个“英雄梦”！先放效果图：知识回顾大家是不是迫不及待了呢？且慢，要实现《明日方舟》游戏的深度强化学习，还是先让我带大家回顾一下深度强化学习算法历史。DQN是深度强化学习算法开山之作，在经典街机游戏上取得了非常好的效果。它使用了ReplyMemory来存储和回放经验，这是Off-policy类型算法的常用技巧。但是，DQN在应对手机游戏时，能力就不够看了。于是我把目光投向了更为强大的算法--- A3C。A3C算法与DQN ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博

推荐文章

程序猿 · 支付宝大楼换上新Logo：无比简洁；马化腾周鸿祎握手 “泯恩仇”；小米深圳国际总部大楼曝光

昨天

程序猿 · 危！比 Python 快 90,000 倍的 Mojo 官宣开源

昨天

程序猿 · 世界上最好的编程语言——PHP排名跌至历史最低

4 天前

OSC开源社区 · 今天面试写了这段代码，能被录取吗？

3 天前

OSC开源社区 · Go语言之父反思错误：“并发”理念指导不足、没做好包管理、用C写了编译器、文档缺失……

5 天前

再生医学网 · 【聚焦疫情】一图读懂，优化疫情防控“20条”

1 年前

财经锐眼 · 一个月翻倍！马斯克“代言”，机器人界的“特斯拉”即将问世？

1 年前

芒格内部讲话 · #芒格金句# The secret of Berkshire i-20220708083200

1 年前

我爱猫咪爱我 · 楼兰新娘

4 年前

高工锂电 · 【鑫东达壳盖•深度】江淮/云度/五菱等加速导入车企高镍动力电池应用盘点

5 年前

关于移动版 · Py中国 · RSS之家 · codingpro · Code · link之家 · 卧龙AI搜索 · 藏经阁 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号