专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
目录
今天看啥  ›  专栏  ›  量子位

32专家MoE大模型免费商用!性能全面对标Llama3,单token推理消耗仅5.28%

量子位  · 公众号  · AI  · 2024-05-30 12:53
    

文章预览

克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 每个token只需要5.28%的算力,精度就能全面对标Llama 3。 开源 大模型,再添一位重量级选手—— 来自浪潮信息的32专家MoE模型,源2.0-M32。 不仅拥有极高的回报投入比,而且全面开放,训练代码和模型权重都可任意下载, 商业使用也免费、无需授权 。 那么,这到底是怎样的一款模型? 1/19算力消耗,性能对标Llama 3 首先了解一下模型的基本信息,源2.0-M32模型采用MoE架构,专家数量为32,总参数量40B,激活专家数为2,激活参数量3.7B。 精度上,源2.0-M32在多个测评数据集上 全面对标Llama3 (70B,以下同) ,在MATH (数学竞赛) 和ARC-C (科学推理) 榜单还上超越了Llama3。 举个例子,在求解一道中文数学题目时,源2.0-M32能够用中文进行完整、准确作答,而Llama3虽然能理解中文题目,但回答时还是用了英文。 而且 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览