专栏名称: 知危
提供敏锐、独到的商业信息与参考,重点关注TMT、出海、新消费、新能源。
目录
今天看啥  ›  专栏  ›  知危

大模型高考数学真实水平曝光:最后一题全体"滑铁卢",看来AI想考清北也难

知危  · 公众号  · 科技媒体  · 2025-06-11 23:06
    

主要观点总结



关键观点总结



文章预览

还记得你高考时被数学最后几道大题支配的恐惧吗? 今天,知危编辑部想让各个 AI 大模型也尝尝滋味。 这并不是整活儿,大模型在推理上天天高呼  “ 取代程序员 ”、“ 取代人类科学家 ” ,那从实际层面, 它 们真的有那么强吗?他们能赢得过大学生最巅峰状态 —— 高考时的状态吗? 知危通过  2025 年高考数学全国卷一卷的最后 5 道解答题 ( 总分 77 分 ) ,对当前主流大语言模型的数学推理能力进行了系统性评测。 测试题目涵盖了统计学、数列、立体几何、解析几何和三角函数等多个数学领域, 对于考察模型在概率计算、证明推理、空间几何分析、参数优化等方面的表现,能提供一些线索。 另外,关于推理模型的有趣特性,也通过答题有所展现。 本次参与评测的模型包括:Gemini 2.5 Preview、智谱Z1、豆包1.5、Claude 4 Sonnet、Qwen3-235B-A22B、DeepS ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览