专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
今天看啥  ›  专栏  ›  量子位

通义实验室新研究:大模型自己「扮演」搜索引擎,提升推理能力无需搜索API

量子位  · 公众号  · AI  · 2025-05-17 11:50
    

文章预览

闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 强化学习(RL)+真实搜索引擎,可以有效提升大模型检索-推理能力。 但问题来了: 一方面,搜索引擎返回的文档质量难以预测,给训练过程带来了噪音和不稳定性。 另一方面,RL训练需要频繁部署,会产生大量API开销,严重限制可扩展性。 现在,来自阿里通义实验室的解决方案公开了:开源 ZeroSearch ,提供了一种 无需与真实搜索引擎交互 的强化学习框架。 实验表明,ZeroSearch仅需3B参数的LLM作为检索模块,即可有效提升搜索能力,节省了高昂API成本。 ZeroSearch让LLM“自给自足”实现搜索进化 研究团队用 模拟搜索环境+渐进式抗噪训练 ,让LLM不再依赖昂贵搜索引擎API。 轻量微调:把LLM变成“搜索引擎模拟器” 用少量标注数据微调LLM,使其能按指令生成两种文档—— 有用结果 和 噪声干扰 。 通过收集与真实 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览