专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
目录
今天看啥  ›  专栏  ›  量子位

苹果炮轰推理模型全是假思考!4个游戏戳破神话,o3/DeepSeek高难度全崩溃

量子位  · 公众号  · AI  · 2025-06-08 11:40
    

文章预览

   梦晨 西风 发自 凹非寺 量子位 | 公众号 QbitAI 苹果最新大模型论文,在AI圈炸开了锅。 有人总结到:苹果刚刚当了一回马库斯,否定了所有大模型的推理能力。 这篇论文称推理模型全都 没在真正思考 ,无论DeepSeek、o3-mini还是Claude 3.7都只是另一种形式的 “模式匹配” ,所谓思考只是一种假象。 再遇到真正高复杂度的任务时所有模型都会崩溃,即使给他们足够的时间和计算资源也无济于事。 作者中包括谷歌大脑创始人之一 Samy Bengio ( 图灵奖得主Yoshua Bengio的弟弟) 。 有网友讽刺纵使苹果拥有最多的资金,2年了也没有拿出像样的成果,现在自己落后了,却来否定别人的成果。 还有人建议苹果要不直接买下Claude背后的公司Anthropic算了,每拖一天都在变贵。 不过也有人指出,这篇论文没有看上去那么消极,而是呼吁设立更好的推理机制和评估办 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览