注册登录

看啥推荐读物

专栏名称: AI前线

InfoQ十年沉淀，为千万技术人打造的专属AI公众号。追踪技术新趋势，跟踪头部科技企业发展和传统产业技术升级落地案例。囊括网站和近万人的机器学习知识交流社群。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

知乎回答RSS订阅方法

知乎专栏 RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

宝玉xp · 转发微博-20240422150943· 昨天

爱可可-爱生活 · 几篇论文实现代码：《Elucidating ...· 2 天前

机器之能 · Gen AI ...· 2 天前

新智元 · 北大图灵班00后学子夺得五金！北大荣获国际大 ...· 3 天前

宝玉xp · 小札之所以在 2022 年买了大量的 ...· 3 天前

今天看啥 › 专栏 › AI前线

微软更新DeepSpeed：可用更少的GPU训练更多的AI模型

AI前线 · 公众号 · AI · 2020-09-20 10:38

作者 | DeepSpeed 团队译者 | Sambodhi 策划 | 钰莹今年 2 月，我们发布了 DeepSpeed 和 ZeRO（Zero Redundancy Optimizer，零冗余优化器），前者是一个开源的深度学习训练优化库，后者是该库中的一种新型内存优化技术，通过提高规模、速度、成本和可用性，极大地推进了大型模型训练。DeepSpeed 研究人员创建了 Turing-NLG，这是最大的语言模型，拥有 170 亿个参数，发布时具有最先进的正确率。今年 5 月，我们发布了 ZeRO-2，它支持 2000 亿个参数的模型训练，比现有技术快 10 倍，同时还提供了一系列计算、I/O 和收敛优化，以实现最快的 BERT 训练。从那时起，我们一直在快速持续创新，推动深度学习训练速度和规模的边界。今天，我们很高兴与大家分享我们的新进展，这些 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博

推荐文章

宝玉xp · 转发微博-20240422150943

昨天

爱可可-爱生活 · 几篇论文实现代码：《Elucidating the Exposu-20240421214228

2 天前

机器之能 · Gen AI 应用需求急剧降速？3月访问量暴跌超 90%

2 天前

新智元 · 北大图灵班00后学子夺得五金！北大荣获国际大学生程序设计竞赛全球总冠军

3 天前

宝玉xp · 小札之所以在 2022 年买了大量的 H100 GPU，即使当时-20240420115319

3 天前

数据皮皮侠 · 【高级会员】世界各国各行业全球价值链数据以及国内价值链GVC测算原始数据（含代码&程序&测算结果等）

2 月前

历史与秩序 · 可以“镇宅”的全球史，一部看透500万年！

3 月前

直播海南 · 关于调整省外来（返）海口人员管理措施的通告

1 年前

算法与数学之美 · 杭州佛学院招硕士当法师：没有KPI，绩效随缘，佛系上班，四点半下班…

2 年前

江门广播电视台 · 明天起，两波冷空气陆续杀到！江门将下雨+降温！未来7天更是...

5 年前

关于移动版 · Py中国 · RSS之家 · codingpro · Code · link之家 · 卧龙AI搜索 · 藏经阁 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号