专栏名称: 机器之心

专业的人工智能媒体和产业服务平台

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

TodayRss-海外稳定RSS

智能体系统如何「边做边学」？斯坦福团队探索在线优化的新范式

机器之心 · 公众号 · AI · 2025-10-24 17:11

主要观点总结

本文介绍了斯坦福大学联合其他机构提出的一种新型智能体训练框架AgentFlow，旨在解决现有智能体在复杂推理和工具调用方面的不足。该框架采用多个独立Agent模块协作，并提出Flow-GRPO算法进行训练。在评测中，AgentFlow在多个领域取得了显著提升，即使对于较小的模型也能超越大规模模型的表现。该研究展示了让智能体在系统中自我适应与持续学习的潜力。

关键观点总结

关键观点1: AgentFlow框架的提出

为了解决智能体进行复杂推理与工具调用的现有问题，斯坦福大学等机构提出了AgentFlow框架，通过多个独立Agent模块协作，实现智能体系统的自我适应与持续学习。

关键观点2: Flow-GRPO算法的应用

AgentFlow提出Flow-GRPO算法用于训练智能体，该算法能够在长时跨度且奖励稀疏的条件下，稳定且高效地训练智能体。

关键观点3: AgentFlow的显著提升

在多项基准测试中，AgentFlow的表现超越了现有领先方法，甚至超过了大规模专有模型，如GPT-4o。一些有趣的发现包括模型规模并非唯一答案，以及在流中学习的重要性。

关键观点4: AgentFlow的创新点

AgentFlow的创新在于其模块化的智能体结构，以及规划器在智能体交互的「流」中的实时优化。此外，Flow-GRPO算法使智能体能够在推理流中协同演化，实现自适应推理与鲁棒工具调用。

关键观点5: AgentFlow的潜力与影响

尽管仍处于研究探索阶段，但AgentFlow为智能体训练提供了新的思路，将群体智能与「边做边学」的范式相结合，使智能体系统能够在协同演化中不断优化，高效应对复杂任务。这表明Agentic AI蕴藏着巨大的潜力与想象空间。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
文章地址：访问文章快照

分享到微博

推荐文章

机器之心 · 从 ReasoningBank 到 MetaAgent，RL 未必是 Agent 自进化的必要解？

昨天

宝玉xp · 现在可以用AI把古诗画出来，大部分时候还画的不错//@汪爸刀刀:-20251025071234

昨天

奇舞精选 · 奇舞周刊第572期：信息量很大！AI结对编程核心思维模型

昨天

新智元 · 奥特曼亲自操刀，为日韩定制「AI强国」蓝图

2 天前

机器之心 · NeurIPS 2025 Spotlight | 让检索、推理真正「合体」的小而强模型，AceSearcher来了

2 天前

亮见数字城市 · 数据资产的识别确认与价值评估！

1 年前

JitLogistics · 敏捷供应链管理与物流

10 月前

9点健康说 · “把开塞露涂到脸上？”最近流行的护肤方式惊呆不少人！有人吹爆，有人连夜挂急诊……

6 月前

第一财经 · 突发！A股又曝“天价离婚”

5 月前

上海邮政 · 还在纠结母亲节祝福说不出口？别急，嘴替来了🥰→

5 月前