看啥推荐读物

专栏名称: PaperWeekly

PaperWeekly是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台，致力于让国内外优秀科研工作得到更为广泛的传播和认可。社区：http://paperweek.ly | 微博：@PaperWeekly

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

知乎回答RSS订阅方法

知乎专栏 RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

深入浅出看懂AlphaGo Zero - PaperWeekly 第51期

PaperWeekly · 公众号 · 科研 · 2017-10-24 16:57

作者丨刘遥行学校丨圣何塞州立大学研究生研究方向丨AI与现实生活的工业结合AlphaGo Zero = 启发式搜索 + 强化学习 + 深度神经网络，你中有我，我中有你，互相对抗，不断自我进化。使用深度神经网络的训练作为策略改善，蒙特卡洛搜索树作为策略评价的强化学习算法。1. 论文正文内容详细解析先上干货论文：Mastering the Game of Go without Human Knowledge [1]，之后会主要以翻译论文为主，在语言上尽量易懂，避免翻译腔。AlphaGo Zero，从本质上来说完全不同于打败樊麾和李世石的版本。算法上，自对弈强化学习，完全从随机落子开始，不用人类棋谱。之前使用了大量棋谱学习人类的下棋风格）。数据结构上，只有黑子白子两种状态。之前包含这个点的气等相关棋盘信息。 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博