专栏名称: PaperWeekly
PaperWeekly是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台,致力于让国内外优秀科研工作得到更为广泛的传播和认可。社区:http://paperweek.ly | 微博:@PaperWeekly
目录
今天看啥  ›  专栏  ›  PaperWeekly

长推理≠高精度!自适应切换“秒答”与“深思”:省Token与提精度的双赢哲学

PaperWeekly  · 公众号  · 科研  · 2025-05-27 13:41
    

文章预览

引言 推理能力的进步极大提升了大语言模型(LLMs)和多模态大语言模型(MLLMs)在各类任务中的表现。但过度依赖思维链(CoT)推理会降低模型性能,产生冗长输出,影响效率。 研究发现,长 CoT 推理并非总能提升准确率,甚至会削弱模型处理简单任务的能力。为此,我们提出 基于置信度的自适应推理框架(CAR) ,它能根据模型困惑度动态选择短回答或详细的长文本推理:首先生成简短回答并评估困惑度,仅在模型置信度低(困惑度高)时触发推理。 在多模态视觉问答、关键信息提取及文本推理等多个基准测试中,CAR 超越了单纯的短回答与长推理方法,实现了准确性与效率的最佳平衡。    论文标题: Prolonged Reasoning Is Not All You Need: Certainty-Based Adaptive Routing for Efficient LLM/MLLM Reasoning 论文地址: https://arxiv.org/abs/2505.15154  相关工作 CAR 是第一个自 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览