普林斯顿团队领衔发布最强开源数学定理证明模型：32B性能大幅超越前代SOTA DeepSeek 67...

机器之心 · 公众号 · AI · 2025-07-17 13:03

主要观点总结

新一代开源数学定理证明模型Goedel-Prover-V2被推出，该项目由普林斯顿大学等顶尖机构联合研发。其中，32B旗舰模型在多个自动数学定理证明的主要基准测试上表现出色，超过之前的SOTA模型DeepSeek-Prover-V2-671B。而8B小尺寸模型在特定基准上，性能与前述模型持平。此外，该模型在效率和能力上取得了新突破，包括在MiniF2F、PutnamBench等测试中的表现。主要技术包括专家迭代与强化学习、分层式数据合成等。模型及数据集已公开发布。

关键观点总结

关键观点1: Goedel-Prover-V2项目推出新一代开源数学定理证明模型

该项目由普林斯顿大学、清华大学、北京大学、上海交通大学、斯坦福大学等顶尖机构以及英伟达、亚马逊、MetaFAIR等多家公司的研究者共同研发。

关键观点2: 模型的性能表现

32B旗舰模型在多个自动数学定理证明的主要基准测试上大幅超过之前的SOTA模型DeepSeek-Prover-V2-671B；8B小尺寸模型在特定基准上，性能与前述模型持平。

关键观点3: 模型的技术创新

Goedel-Prover-V2的技术创新包括专家迭代与强化学习、分层式数据合成、验证器引导的自我修正和模型平均等方法。

关键观点4: 模型的公开与下载

为了支持开源社区的研究，团队已经公开发布了Goedel-Prover-V2模型和全新的MathOlympiadBench基准。模型及数据集下载链接已在文中提供。

关键观点5: 项目骨干与负责人介绍

项目骨干包括林勇、唐山茖等，项目负责人是金驰教授。他们的研究方向包括大模型的形式化数学推理、后训练、强化学习等。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博

推荐文章

新智元 · 奥特曼之后，库克也哭晕在厕所？Meta疯狂砸钱，苹果AI核心要被连锅端！

19 小时前

AI产品阿颖 · ChatGPT Agent 的重要性不亚于 GPT-5

23 小时前

机器之心 · 昨晚，云计算一哥打造了一套Agent落地的「金铲子」

昨天

AI科技评论 · 2025 上半年具身智能融资复盘：金额超 200 亿、头部收敛趋势明显、传统制造业巨头增多

2 天前

爱可可-爱生活 · OpenTrader：一款开源的加密货币交易机器人，支持多交易所-20250716141630

2 天前

哥飞 · 【哥飞转载】活动回顾｜ AI SaaS 出海 SEO 与 AI 原生 CMS 实践

1 年前

粥左罗 · “39岁失业后，为了卖房，我卧底中介300天，发现......”

6 月前

老兵圈 · “这个船啊，像在海水里‘泡大了’一样~”

2 月前