【NTU博士论文】基于协作式多智能体强化学习的决策制定

数据派THU · 公众号 · 大数据 · 2025-05-03 17:00

文章预览

来源：专知本文约1000字，建议阅读 5 分钟本博士论文旨在针对三类关键的多智能体研究问题提出解决方案，内容涵盖从理论分析到实际应用。强化学习（Reinforcement Learning）作为一种机器学习技术，已在解决复杂的序列决策问题中取得显著进展。许多实际任务涉及多个智能体，并需要通过序列决策策略以达成共同目标，例如仓库自动化、自动驾驶及游戏对抗等。为了为所有智能体学习合适的策略，这类问题可建模为多智能体系统，并通过多智能体强化学习（Multi-Agent Reinforcement Learning, MARL）进行求解。然而，在多智能体场景下优化策略仍面临诸多挑战，主要原因在于智能体行为的复杂性以及环境动态的非平稳性。首先，在部分可观测环境中，多智能体行为的复杂性显著增加了策略优化的难度。此外，智能体行为的动态变化及其与其他智能体之间 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博