燕园 |北大联合360震撼发布！5%参数量逼近Deepseek-R1满血性能

北大青年CEO俱乐部 · 公众号 · · 2025-03-01 18:00

文章预览

【重要提醒】有粉丝私信说，有时收不到北大青年CEO俱乐部的推送。这是因为微信调整了推荐机制。如不想错过每期推文，请为北大青年CEO俱乐部加上星标！随手点击下方名片→ 点右上角（…）弹出菜单栏→点“ 设为星标 ”即可。 2025年2月24日 ——由360与北京大学联合研发的中等量级推理模型Tiny-R1-32B-Preview正式亮相，仅以5%参数，逼近Deepseek-R1-671B的性能。模型参数量数学 (AIME 2024) 代码 (LiveCodeBench) 科学 (GPQA-Diamond) Deepseek-R1-Distill-Qwen-32B 32B 72.6 57.2 62.1 Deepseek-R1-Distill-Llama-70B 70B 70 57.5 65.2 Deepseek-R1 671B 79.8 65.9 71.5 Tiny-R1-32B-Preview 32B 78.1 61.6 65 核心突破：小模型，大能量数学领域：以78.1分（AIME 2024评测）逼近原版R1模型（79.8分），远超Deepseek-R1-Distill-Llama-70B（70.0分）；综合性能：在编程（LiveCodeBench 61.6分）、科学（GPQA-Diamond 65.0分）领域全 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博