学习：浅谈强化学习原理（附代码&链接）

数据分析 · 公众号 · 大数据 · 2019-11-27 08:49

作者：Michel Kana 翻译：王琦校对：王雨桐本文约4900字，建议阅读15分钟。本文介绍了强化学习的基本原理，并通过代码实例来讲解如何找到最优策略。Google在2017年年底发布了AlphaZero，这个零基础的AI系统能够在4小时内自学并掌握国际象棋、围棋和将棋。极短的训练时间是 AlphaZero击败世界顶级国际象棋程序的致命武器。Andriy Popov / Alamy Stock 照片最近，OpenAI 展示了强化学习不是一个仅限于虚拟任务的工具。Dactyl的类人机械手已经学会了如何独立解魔方(见下面链接)。附链接：https://openai.com/blog/solving-rubiks-cube/Google AlphaZero和OpenAI Dactyl的本质都是强化学习算法，它不基于任何相关领域的知识，我们只需要给定游戏的规则。一些AI专家认为这是实现人类或超人类的通用人工 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博

推荐文章

大数据文摘 · Llama 3上线4天，井喷1000多个变种！中文版也有了！Groq上推理速度800token每秒

昨天

软件定义世界（SDX） · 艾瑞咨询2023年中国电商市场研究报告

3 天前

软件定义世界（SDX） · 知名风投FirstMark详解2024年国际AI生态

4 天前

CDA数据分析师 · 【干货】利用python做同期群分析

1 周前

大数据文摘 · 斯坦福发文：AI写论文比例激增，CS专业是重灾区，现状堪忧！

1 周前

学术经纬 · 清华大学医学院程功实验室招聘博士后

8 月前

胡锡进观察 · 为什么说在中国家门口打仗我们不用怕？

3 年前

Android编程精选 · Spring Boot 操作 Redis 的各种实现

2 年前

营销航班 · 借势，就是探索出一组共生关系「梁宁增长课组队学习连载21」

4 年前

学习 ：浅谈强化学习原理（附代码&链接）

学习：浅谈强化学习原理（附代码&链接）