大语言模型复杂推理的自我进化机制：研究综述与前沿展望

专知 · 公众号 · · 2025-04-18 11:00

文章预览

摘要 OpenAI的O1及其后续竞争者（如DeepSeek R1）的发布显著推动了大语言模型（Large Language Models，LLMs）在复杂推理方面的研究，引发学术界与工业界的双重关注。此项进展激发了相关技术成果的复现和在此基础上的创新。为系统构建该领域的研究框架，本文从自我进化（self-evolution）的角度系统地分类了现有技术。我们的调查发现分为三个相互关联的部分：数据进化（data evolution）、模型进化（model evolution）和自我进化（self-evolution）。数据进化部分改进推理训练数据，这包括任务进化和增强思维链（Chain-of-Thought，CoT）推理的推理时间计算。模型进化部分通过在训练过程中优化模型模块，以增强复杂推理能力。自我进化部分则探讨其进化策略和模式。包括自我进化的规模法则（scaling law）与对 O1 类研究工作的分析。通过系统梳理相关研究，我们总 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

黄建同学 · 30个博客学习 30 个系统设计基础知识：1. API：网页链-20250517115734

23 小时前

AI前线 · 突袭Cursor，Windsurf抢发自研大模型！性能比肩Claude 3.5、但成本更低，网友好评：响应快、不废话

昨天

厦门日报 · 重磅新规！证监会宣布了！

昨天

爱可可-爱生活 · 【[125星]Awesome-KV-Cache-Manageme-20250515214628

2 天前

爱可可-爱生活 · 晚安～ #晚安# -20250514225650

3 天前

廉洁江西 · 国家烟草专卖局一副局长被查！

11 月前

国企求职网 · 中国东方航空2025全球校园招聘正式启动！

8 月前

无锡博报生活 · 注意！又降了！

4 周前