32专家MoE大模型免费商用！性能全面对标Llama3，单token推理消耗仅5.28%

量子位 · 公众号 · AI · 2024-05-30 12:53

文章预览

克雷西发自凹非寺量子位 | 公众号 QbitAI 每个token只需要5.28%的算力，精度就能全面对标Llama 3。开源大模型，再添一位重量级选手—— 来自浪潮信息的32专家MoE模型，源2.0-M32。不仅拥有极高的回报投入比，而且全面开放，训练代码和模型权重都可任意下载，商业使用也免费、无需授权。那么，这到底是怎样的一款模型？ 1/19算力消耗，性能对标Llama 3 首先了解一下模型的基本信息，源2.0-M32模型采用MoE架构，专家数量为32，总参数量40B，激活专家数为2，激活参数量3.7B。精度上，源2.0-M32在多个测评数据集上全面对标Llama3 （70B，以下同），在MATH （数学竞赛）和ARC-C （科学推理）榜单还上超越了Llama3。举个例子，在求解一道中文数学题目时，源2.0-M32能够用中文进行完整、准确作答，而Llama3虽然能理解中文题目，但回答时还是用了英文。而且 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

AI产品阿颖 · Cursor核心成员访谈：我们对AI编程的几个关键判断

16 小时前

新智元 · 陶哲轩重写20年本科经典教材！Lean编程数学证明，GitHub已放出

17 小时前

Dance with GenAI · AI数据中心的光子集成芯片（PICs）发展路线图

20 小时前

量子位 · 斯坦福意外用AI生成超强CUDA内核，性能比人类专家优化得还要好！翻倍碾压原生PyTorch，华人主创

昨天

爱可可-爱生活 · //@爱可可-爱生活：欢迎参与～-20250531081847

2 天前

润禾材料 · 展会丨润禾材料参加第10届中国（上海）国际数据中心产业展览会获圆满成功

11 月前

东莞滨海湾新区 · 滨海湾三个民生保障住宅新增补市重大项目！

10 月前

WallStreetTequila · 第2张CCI Offer！UCLA研究生学员斩获CCI Stamford 2025年暑期实习Offer

5 月前

内蒙古掌上12348 · 赛罕区：法援讲座护航成长

1 月前

内蒙古掌上12348 · 赛罕区：法援讲座护航成长

1 月前