注册登录

看啥推荐读物

专栏名称: 机器之心

专业的人工智能媒体和产业服务平台

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

知乎回答RSS订阅方法

知乎专栏 RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

机器之能 · 开源大模型Llama ...· 昨天

机器之心 · 首个国产音乐SOTA模型来了！专为中文优化， ...· 2 天前

宝玉xp · 还好这几个我都没尬吹过-2024041609 ...· 4 天前

宝玉xp · 福布斯发布2024年人工智能初创企业50强随 ...· 5 天前

爱可可-爱生活 · 【收集了基于 ...· 5 天前

今天看啥 › 专栏 › 机器之心

继1小时训练ImageNet之后，大批量训练扩展到了3万2千个样本

机器之心 · 公众号 · AI · 2017-08-20 14:06

选自arXiv机器之心编译参与：蒋思源、李亚洲、路雪自 Facebook 发布 1 小时训练 ImageNet 论文以来，很多研究者都在关注如何使用并行训练来提高深度学习的训练速度。Facebook 提出了一种提高批量大小的分布式同步 SGD 训练方法，而 Yang You 等人在 Facebook 的论文上更进一步采用层级对应的适应率缩放（LARS）来对每一层网络使用不同的学习率。他们在 AlexNet 和 ResNet-50 模型上分别实现了 8129 和 32768 的批量大小，而且在加速训练的同时还保证了模型的准确度。论文地址：https://arxiv.org/abs/1708.03888加速训练大型神经网络最自然的方式就是在多块 GPU 上使用数据平行化。为了将基于随机梯度的方法扩展到更多的处理器，我们需要增加批量大小以充分利用每块 G ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博

推荐文章

机器之能 · 开源大模型Llama 3王者归来！最大底牌4000亿参数，性能直逼GPT-4

昨天

机器之心 · 首个国产音乐SOTA模型来了！专为中文优化，免费用，不限曲风

2 天前

宝玉xp · 还好这几个我都没尬吹过-20240416093137

4 天前

宝玉xp · 福布斯发布2024年人工智能初创企业50强随着人工智能热潮的持续-20240415090057

5 天前

爱可可-爱生活 · 【收集了基于 NeRF的逆渲染论文的资源集合】'Awesome--20240414145349

5 天前

康龙梅 · 跨越阶层真的有点难

3 年前

THLDL领导力 · 央视爆料；全是假货，没有一件真品！

4 年前

周国平 · 父母的眼界，决定孩子未来的高度

5 年前

我爱设计 · 设计与科学

5 年前

闻古知新 · 楚汉系列丨来自咸阳的责难

5 年前

关于移动版 · Py中国 · RSS之家 · codingpro · Code · link之家 · 卧龙AI搜索 · 藏经阁 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号