专栏名称: 新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

「DeepSeek二代」来袭！数学暴击o3，英伟达开源LLM登顶

新智元 · 公众号 · AI · 2025-07-20 18:09

主要观点总结

英伟达推出基于Qwen2.5架构的OpenReasoning-Nemotron模型，采用DeepSeek-R1-0528生成数据。该模型在多个基准测试中表现优异，特别是在数学、科学和代码任务上创下新纪录。模型提供四种参数规模，可在本地100%运行。核心贡献者介绍了模型的亮点，并强调了参数规模对性能的影响。模型表现出强大的推理能力，并能在不使用强化学习的情况下实现泛化。模型发布主要是为了验证生成的新数据的价值，并探索仅通过监督微调能将性能推到何种程度。

关键观点总结

关键观点1: OpenReasoning-Nemotron模型基于Qwen2.5架构，采用DeepSeek-R1-0528生成数据。

该模型在多个基准测试中表现突出，提供了四种不同参数规模，可在本地运行。

关键观点2: 模型在数学、科学和代码任务上表现优异。

该模型在参数高达671B的DeepSeek-R1-0528蒸馏后，在5M的数学、代码和科学推理轨迹上训练，实现了真正的推理能力。

关键观点3: 模型支持重型推理模式，可以结合多个智能体的工作。

使用GenSelect算法，该模型在多个数学基准测试中超越了OpenAI o3。

关键观点4: 模型发布的主要目标是验证生成的新数据的价值，并探索仅通过监督微调能将性能推到何种程度。

此次发布也揭示了参数规模对模型性能的重大影响，以及模型在解决推理任务时的优异表现。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博

推荐文章

机器学习研究组订阅 · 终结Coding？ShellAgent三句话造出马斯克同款「AI女友」！

1小时前

爱可可-爱生活 · 《爱可可微博热门分享(7.22)》爱可可微博热门分享(7.2-20250722223517

22 小时前

AI科技大本营 · 对话谷歌前 CEO Eric Schmidt：数字超智能将在十年内到来，AI 将创造更多更高薪的工作

昨天

新智元 · 硅谷年度「分尸案」！带头卷走24亿跑路，明星创始人遭VC集体拉黑

昨天

爱可可-爱生活 · ZITADEL：为复杂多租户身份管理打造的开源一体化解决方案，兼-20250722065953

昨天

浪潮新消费 · 爆品GMV增长超150%！雷士照明、德佑等品牌携手阿里妈妈打爆618，抢占生意增量

1 年前

江苏招聘信息 · 江苏南通市如东县丰利镇中心卫生院招聘公告

1 年前

诗词天地 · 精辟的10句话，读完治愈一生！

11 月前

贸大就业 · 校招｜北京中学科技分校启动2025届毕业生校园招聘

9 月前

锦观新闻 · 突发！山西4.1级地震，多地震感明显

6 月前