MA2MB：基于多智能体互建议模型的强化学习在追逃博弈中的应用

Baolin Zhao, Qi Guo, Xiandong Wang, Rachid Hedjam, Guoqiang Zhong

摘要

该论文提出了一种多智能体互建议的模型强化学习方法，用于解决追逃博弈问题。通过智能体间的相互建议机制，提升了模型的学习效率和策略性能。

multi-agentreinforcement learningpursuit-evasionmodel-basedmutual-advising

LEARNING

📊 8,465 引用

D. O. Hebb

2005

LEARNING

📊 7,678 引用

Benoît B. Mandelbrot, John W. Van Ness

1968

LEARNING

开放获取📊 7,484 引用

Laith Alzubaidi, Jinglan Zhang, Amjad J. Humaidi 等 10 位作者

2021

LEARNING

📊 4,608 引用

Andre Esteva, Alexandre Robicquet, Bharath Ramsundar 等 10 位作者

2018