文章预览
基于大型语言模型(LLMs)的Agent 在 全局规划 中容易进行 无脑试错 ,在 局部规划 中生成 幻觉动作 ,因为它们对“真实”物理世界的理解不足。 人类在面对特定任务时,会利用丰富的先验知识在心中预演整个过程,然后才采取行动,这种知识被称为 全局任务知识 。 在任务过程中,还会不断维护一种局部状态知识,代表对 当前世界状态的认知 。 缺乏世界知识会导致在早期规划阶段出现盲目试错,在后期则可能导致对当前世界状态的混乱认知并生成幻觉动作。 传统Agent规划与使用世界知识模型的Agent规划 为了解决这一问题,提出了 参数化的世界知识模型(WKM:World Knowledge Model) ,以促进Agent规划。 模仿人类的心理世界知识模型在任务之前提供全局先验知识,并在任务期间保持局部动态知识。 WKM概述。 智能体模型自身从专家和探索轨迹合成的
………………………………