专栏名称: AI数据派
THU数据派"基于清华,放眼世界",以扎实的理工功底闯荡“数据江湖”。发布全球大数据资讯,定期组织线下活动,分享前沿产业动态。了解清华大数据,敬请关注姐妹号“数据派THU”。
今天看啥  ›  专栏  ›  AI数据派

Python 还能实现哪些 AI 游戏?附上代码一起来一把!

AI数据派  · 公众号  ·  · 2020-06-18 21:30
    

文章预览

来源:AI科技大本营 作者: 李秋键 责编: Carol 本文约 4562字 ,建议阅读 10分钟 。 本 文 以DQN算法为例介绍如何用Python 实现AI 游戏,赶快来试一下吧。 人工智能作为当前热门在我们生活中得到了广泛应用,尤其是在智能游戏方面,有的已经达到了可以和职业选手匹敌的效果。而DQN算法作为智能游戏的经典选择算法,其主要是通过奖励惩罚机制来迭代模型,来达到更接近于人类学习的效果。 那在强化学习中, 神经网络是如何被训练的呢? 首先, 我们需要 a1, a2 正确的Q值, 这个 Q 值我们就用之前在 Q learning 中的 Q 现实来代替. 同样我们还需要一个Q估计来实现神经网络的更新. 所以神经网络的的参数就是老的NN参数加学习率 alpha乘以Q现实和Q估计的差距。 我们通过 NN 预测出Q( ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览