注册登录

看啥推荐读物

专栏名称: 深度强化学习实验室

主要介绍深度学习、强化学习、深度强化学习环境、算法原理与实现、前沿技术与论文、开源项目、场景应用等与DRL相关的知识

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

知乎回答RSS订阅方法

知乎专栏 RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

广东疾控 · 高脂血症是个“温柔杀手”，瘦子和年轻人都能中招→· 5 小时前

广东疾控 · 起病隐匿、发现已晚期！如何提早发现卵巢癌？注 ...· 昨天

丁香生活研究 · 拒绝无用功！这份抗衰新思路请你收好· 3 天前

丁香医生 · 一个常见的生活习惯，可能导致尿路结石· 5 天前

丁香医生 · 体检发现幽门螺杆菌感染，不治疗会得胃癌吗？· 5 天前

今天看啥 › 专栏 › 深度强化学习实验室

【总结】强化学习需要批归一化(Batch Norm)吗？

深度强化学习实验室 · 公众号 · · 2020-10-09 07:35

深度强化学习实验室来源: 知乎专栏(https://www.zhihu.com/people/ceng-yi-yan-8)授权转载作者：曾伊言, 编辑：DeepRL深度强化学习算法 (DRL, Deep Reinforcement Learning Algorithm) 的神经网络是否需要使用批归一化 (BN, Batch Normalization) ？深度强化学习不需要批归一化，但是可以用归一化（长话短说）1. BN在RL中是如何失效的？在深度学习中BN很有用。特别是在监督学习中，我们从训练集中抽取数据进行训练，通过随机抽取保证每个批次的数据符合独立同分布 (i.i.d.)。在这种稳定的训练环境下，BN可以计算出一个变化稳定的 mean 和 std 用于归一化。BN很有用，详见 Paper3 Batch normalization: Accelerating deep network training by reducing internal covariate shift. 2015. 这里还解释了BN如何起作用。BN如何用，详见从双 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博

推荐文章

广东疾控 · 高脂血症是个“温柔杀手”，瘦子和年轻人都能中招→

5 小时前

广东疾控 · 起病隐匿、发现已晚期！如何提早发现卵巢癌？注意这8个信号→

昨天

丁香生活研究 · 拒绝无用功！这份抗衰新思路请你收好

3 天前

丁香医生 · 一个常见的生活习惯，可能导致尿路结石

5 天前

丁香医生 · 体检发现幽门螺杆菌感染，不治疗会得胃癌吗？

5 天前

看理想 · 《乐夏3》完结，最大的惊喜是她们

6 月前

金机报晓 · 【党风廉政】区人大机关党组开展勤廉教育和家风建设活动

1 年前

新能源汽车报V · 关注 | 交通部：全面暂停进出京跨城网约车顺风车业务

4 年前

云南网 · 买的33层，建好的楼盘却只有31层！昆明上百户业主懵了...

4 年前

FM93交通之声 · 比“呵呵”更讨厌！刚刚过去的2016年，原来说这三个字最招人烦…

7 年前

关于移动版 · Py中国 · RSS之家 · codingpro · Code · link之家 · 卧龙AI搜索 · 藏经阁 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号