今天看啥  ›  专栏  ›  北大青年CEO俱乐部

燕园 |北大联合360震撼发布!5%参数量逼近Deepseek-R1满血性能

北大青年CEO俱乐部  · 公众号  ·  · 2025-03-01 18:00
    

文章预览

【 重要提醒 】有粉丝私信说,有时收不到 北大青年CEO俱乐部 的推送。这是因为微信调整了推荐机制。如不想错过每期推文,请为 北大青年CEO俱乐部 加上 星标 !随手点击下方名片→ 点右上角(…) 弹出菜单栏→点“ 设为星标 ”即可。 2025年2月24日 ——由360与北京大学联合研发的中等量级推理模型Tiny-R1-32B-Preview正式亮相,仅以5%参数,逼近Deepseek-R1-671B的性能。 模型 参数量 数学 (AIME 2024) 代码 (LiveCodeBench) 科学 (GPQA-Diamond) Deepseek-R1-Distill-Qwen-32B 32B 72.6 57.2 62.1 Deepseek-R1-Distill-Llama-70B 70B 70 57.5 65.2 Deepseek-R1 671B 79.8 65.9 71.5 Tiny-R1-32B-Preview 32B 78.1 61.6 65  核心突破:小模型,大能量 数学领域: 以78.1分(AIME 2024评测)逼近原版R1模型(79.8分),远超Deepseek-R1-Distill-Llama-70B(70.0分); 综合性能: 在编程(LiveCodeBench 61.6分)、科学(GPQA-Diamond 65.0分)领域全 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览