首页 /研究 /MA2MB:基于多智能体互建议模型的强化学习在追逃博弈中的应用
LEARNING📊 0 引用

MA2MB:基于多智能体互建议模型的强化学习在追逃博弈中的应用

Baolin Zhao, Qi Guo, Xiandong Wang, Rachid Hedjam, Guoqiang Zhong

Robotics and Autonomous Systems · 2026

摘要

该论文提出了一种多智能体互建议的模型强化学习方法,用于解决追逃博弈问题。通过智能体间的相互建议机制,提升了模型的学习效率和策略性能。

关键词

multi-agentreinforcement learningpursuit-evasionmodel-basedmutual-advising

相关论文