专栏名称: DeepTech深科技
“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面:1、基于科学的发现;2、真正的科技创新;3、深科技应用的创新。
今天看啥  ›  专栏  ›  DeepTech深科技

英伟达开源AIMO奥赛冠军模型,仅用1.4B参数量超越14B DeeSeek-R1

DeepTech深科技  · 公众号  · 科技媒体  · 2025-04-27 17:44
    

文章预览

英伟达 正式开源了其不久前在 AI 数学奥林匹克竞赛(AIMO, AI Mathematical Olympiad)中斩获冠军的核心模型系列。 在本届 AIMO-2 Kaggle 竞赛中,超过 2,200 支参赛队伍提交了 AI 模型,挑战在 5 小时内解决 50 道国家奥林匹克级别的复杂数学问题。英伟达的 7 人团队“NemoSkills”最终正确解答了 34 道题目(相比 2024 年的冠军提高了 5 道),夺得了冠军。 图丨此次比赛的排行榜(来源:Kaggle) 现在,英伟达向全球开放了帮助他们获胜的核心技术,包括小参数的 OpenMath-Nemotron-1.5B、OpenMath-Nemotron-7B 和直接用于竞赛并优化的 OpenMath-Nemotron-14B-Kaggle 模型、性能更为强大的旗舰模型 OpenMath-Nemotron-32B,以及训练它们所依赖的 OpenMathReasoning 数据集。 基准测试的结果显示, 这几款模型表现出色,在 AIME 和 HMMT 竞赛中数学问题上的准确率全面超越了 14B 的 DeepSeek-R1。 图丨 AIM ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览