专栏名称: 数据派THU
本订阅号是“THU数据派”的姊妹账号,致力于传播大数据价值、培养数据思维。
目录
相关文章推荐
大数据文摘  ·  OpenAI ... ·  昨天  
今天看啥  ›  专栏  ›  数据派THU

【NTU博士论文】基于协作式多智能体强化学习的决策制定

数据派THU  · 公众号  · 大数据  · 2025-05-03 17:00
    

文章预览

来源:专知 本文 约1000字 ,建议阅读 5 分钟 本博士论文旨在针对三类关键的多智能体研究问题提出解决方案,内容涵盖从理论分析到实际应用。 强化学习(Reinforcement Learning)作为一种机器学习技术,已在解决复杂的序列决策问题中取得显著进展。许多实际任务涉及多个智能体,并需要通过序列决策策略以达成共同目标,例如仓库自动化、自动驾驶及游戏对抗等。为了为所有智能体学习合适的策略,这类问题可建模为多智能体系统,并通过多智能体强化学习(Multi-Agent Reinforcement Learning, MARL)进行求解。 然而,在多智能体场景下优化策略仍面临诸多挑战,主要原因在于智能体行为的复杂性以及环境动态的非平稳性。首先,在部分可观测环境中,多智能体行为的复杂性显著增加了策略优化的难度。此外,智能体行为的动态变化及其与其他智能体之间 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览