文章预览
【 重要提醒 】有粉丝私信说,有时收不到 北大青年CEO俱乐部 的推送。这是因为微信调整了推荐机制。如不想错过每期推文,请为 北大青年CEO俱乐部 加上 星标 !随手点击下方名片→ 点右上角(…) 弹出菜单栏→点“ 设为星标 ”即可。 2025年2月24日 ——由360与北京大学联合研发的中等量级推理模型Tiny-R1-32B-Preview正式亮相,仅以5%参数,逼近Deepseek-R1-671B的性能。 模型 参数量 数学 (AIME 2024) 代码 (LiveCodeBench) 科学 (GPQA-Diamond) Deepseek-R1-Distill-Qwen-32B 32B 72.6 57.2 62.1 Deepseek-R1-Distill-Llama-70B 70B 70 57.5 65.2 Deepseek-R1 671B 79.8 65.9 71.5 Tiny-R1-32B-Preview 32B 78.1 61.6 65 核心突破:小模型,大能量 数学领域: 以78.1分(AIME 2024评测)逼近原版R1模型(79.8分),远超Deepseek-R1-Distill-Llama-70B(70.0分); 综合性能: 在编程(LiveCodeBench 61.6分)、科学(GPQA-Diamond 65.0分)领域全
………………………………