看啥推荐读物
专栏名称: 数据分析
专注大数据,移动/互联网,IT科技,电子商务,数据分析/挖掘等领域的综合信息服务与分享平台。合作|约稿请加qq:365242293
今天看啥  ›  专栏  ›  数据分析

学习 :浅谈强化学习原理(附代码&链接)

数据分析  · 公众号  · 大数据  · 2019-11-27 08:49
作者:Michel Kana  翻译:王琦  校对:王雨桐本文约4900字,建议阅读15分钟。本文介绍了强化学习的基本原理,并通过代码实例来讲解如何找到最优策略。Google在2017年年底发布了AlphaZero,这个零基础的AI系统能够在4小时内自学并掌握国际象棋、围棋和将棋。极短的训练时间是 AlphaZero击败世界顶级国际象棋程序的致命武器。Andriy Popov / Alamy Stock 照片最近,OpenAI 展示了强化学习不是一个仅限于虚拟任务的工具。Dactyl的类人机械手已经学会了如何独立解魔方(见下面链接)。附链接:https://openai.com/blog/solving-rubiks-cube/Google AlphaZero和OpenAI Dactyl的本质都是强化学习算法,它不基于任何相关领域的知识,我们只需要给定游戏的规则。一些AI专家认为这是实现人类或超人类的通用人工 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照