专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
今天看啥  ›  专栏  ›  爱可可-爱生活

本文提出的“软思考”(Soft Thinking)是一种无需训练-20250523053412

爱可可-爱生活  · 微博  · AI  · 2025-05-23 05:34
    

文章预览

2025-05-23 05:34 本条微博链接 本文提出的“软思考”(Soft Thinking)是一种无需训练的推理框架,它通过让大型语言模型在由概率加权词元嵌入构成的“概念词元”所形成的连续概念空间中进行推理,并辅以“冷停止”机制,从而在不牺牲可解释性的前提下,显著提升了模型在数学和代码任务上的准确率和词元效率,其反直觉之处在于简单的概率加权混合远优于直接使用隐藏态或平均嵌入,并揭示了保持推理过程的“软性” ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览