注册登录

专栏名称: 视学算法

公众号专注于人工智能 | 机器学习 | 深度学习 | 计算机视觉 | 自然语言处理等前沿论文和基础程序设计等算法。地球不爆炸，算法不放假。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

知乎回答RSS订阅方法

知乎专栏 RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

ZOL中关村在线 · 引领健康护眼新潮流EPRP健康显示护眼评价体 ...· 5 天前

ZOL中关村在线 · iPhone内存不够用怎么办？· 5 天前

好机友 · 神图：真成扫把头了…· 2 天前

ZOL中关村在线 · 哪款手机称得上你心目中的天花板！· 3 天前

好机友 · 潮讯：华为小米在海外卖疯了；苹果新款iPad ...· 1 周前

今天看啥 › 专栏 › 视学算法

一番实验后，有关Batch Size的玄学被打破了

视学算法 · 公众号 · · 2022-07-11 13:08

作者：Sebastian Raschka视学算法编译编辑：泽南有关 batch size 的设置范围，其实不必那么拘谨。我们知道，batch size 决定了深度学习训练过程中，完成每个 epoch 所需的时间和每次迭代（iteration）之间梯度的平滑程度。batch size 越大，训练速度则越快，内存占用更大，但收敛变慢。又有一些理论说，GPU 对 2 的幂次的 batch 可以发挥更好性能，因此设置成 16、32、64、128 … 时，往往要比设置为其他倍数时表现更优。后者是否是一种玄学？似乎很少有人验证过。最近，威斯康星大学麦迪逊分校助理教授，著名机器学习博主 Sebastian Raschka 对此进行了一番认真的讨论。Sebastian Raschka关于神经网络训练，我认为我们都犯了这样的错误：我们选择批量大小为 2 的幂，即 64、128、256、512、1024 等等。（这里，batch size 是指当我们通过基于随机梯度下降的优化算 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博

推荐文章

ZOL中关村在线 · 引领健康护眼新潮流EPRP健康显示护眼评价体系正式亮相

5 天前

ZOL中关村在线 · iPhone内存不够用怎么办？

5 天前

好机友 · 神图：真成扫把头了…

2 天前

ZOL中关村在线 · 哪款手机称得上你心目中的天花板！

3 天前

好机友 · 潮讯：华为小米在海外卖疯了；苹果新款iPadPro隐藏功能；英特尔CEO回怼黄仁勋；斯坦福团队为抄袭道歉

1 周前

经济观察报 · 数说上半年民营经济：仍处于低谷，活力需激发

10 月前

慧通数据 · 今年一季度生猪出栏量处于历史高位，且猪企亏、禽企赚，饲料又涨200元，储备肉收储即将开始！

1 年前

CareerIn投行PEVC求职 · 7.28投行/PE/VC工作机会（校招+社招）：红杉资本/海通资管/青松基金

2 年前

药明康德 · 速递 | 优时比IL17-A\/F双重抑制剂再度达到3期终点，明年递交新药申请

4 年前

中国书法网 · 赏画 | 清髡残《层岩叠壑图》

4 年前

关于移动版 · Py中国 · RSS之家 · codingpro · Code · link之家 · 卧龙AI搜索 · 藏经阁 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号