已节省数百万GPU小时！字节再砍MoE训练成本，核心代码全开源

量子位 · 公众号 · AI · 2025-03-10 17:01

文章预览

COMET团队投稿量子位 | 公众号 QbitAI 字节对MoE模型训练成本再砍一刀，成本可节省40% ！刚刚，豆包大模型团队在GitHub上开源了叫做 COMET 的MoE优化技术。 COMET已应用于字节的万卡训练集群，在真实的生产环境中，累计帮助节省了数百万GPU小时。早前，豆包团队发布了新一代稀疏架构UltraMem，将模型推理成本砍掉 83%，此次，又开源了COMET，向模型训练成本出手。从技术理念上看，两者还可以结合使用，组成一套“砍价刀法” 。具体来看，COMET主要针对的是MoE模型在分布式训练中，仍存在大量通信开销的问题。 COMET内部通过一套细粒度计算-通信折叠技术，并结合GPU资源的动态分配，极致压榨了MoE专家“摸鱼闲置”的时间，在大规模MoE的单个执行层上可提速 1.96倍，端到到平均提速 1.71倍。有趣的是，此前DeepSeek也专门针对MoE的通信瓶颈，开 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

黄建同学 · 万相 Wan2.1 VACE 的工作流，转需-20250524171514

昨天

黄建同学 · 戳视频了解强化学习三种方法的基本概念：RLHF：Reinforc-20250524172428

昨天

爱可可-爱生活 · [CL]《Meta-Design Matters: A Self-20250523055404

3 天前

爱可可-爱生活 · //@爱可可-爱生活：今日开奖，欢迎参与～-20250523060559

2 天前

宝玉xp · Claude 4 全新发布转译自anthropic 官方：今天，-20250523015339

3 天前

哔哩哔哩 · B站这些大学社团，实力还是太全面了

7 月前

智慧交通 · 智慧停车项目汇总（10月第3期）：拉虎皮的多，唱戏的少，看戏的更少……

6 月前