今天看啥  ›  专栏  ›  AI寒武纪

OpenAI Jason wei解读o1:思维链的“顿悟时刻”,大模型不再鹦鹉学舌

AI寒武纪  · 公众号  ·  · 2024-11-10 15:05
    

文章预览

OpenAI的研究员Jason Wei(o1思维链核心开发人员)点出了一个关键但容易被忽视的问题:思维链在o1出现前后发生了巨大的变化,虽然只是名称上多了个"o1",但这背后的含义却远不止如此 o1之前:模仿秀,不是真思考 在o1范式出现之前(即思维链提示的早期阶段),思维链的实际运作方式与我们期望的之间存在着很大的差异。我们希望思维链能够反映模型真正的思考过程,但实际上,模型只是在模仿它在预训练数据中看到的推理路径,例如数学作业的解答。 这类数据的最大问题在于,它们是事后诸葛亮式的总结,作者在其他地方完成了所有思考过程后才写下的答案,而不是真正的思维过程记录。因此,这些答案的信息密度往往很低,一个极端的例子就是“答案是5,因为……”,其中“5”这个词承载了几乎所有的新信息量,而前面的铺垫却冗长而低 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览