首页 /研究 /MAMPS: Safe Multi-Agent Reinforcement Learning via Model Predictive Shielding

LEARNING

MAMPS: Safe Multi-Agent Reinforcement Learning via Model Predictive Shielding

Wenbo Zhang, Osbert Bastani, Vijay Kumar

发表年份: 2019
访问权限: 开放获取

摘要

Reinforcement learning is a promising approach to learning control policies for performing complex multi-agent robotics tasks. However, a policy learned in simulation often fails to guarantee even simple safety properties such as obstacle avoidance. To ensure safety, we propose multi-agent model predictive shielding (MAMPS), an algorithm that provably guarantees safety for an arbitrary learned policy. In particular, it operates by using the learned policy as often as possible, but instead uses a backup policy in cases where it cannot guarantee the safety of the learned policy. Using a multi-agent simulation environment, we show how MAMPS can achieve good performance while ensuring safety.

关键词

eess.SYcs.AIcs.MAcs.RO

MAMPS: Safe Multi-Agent Reinforcement Learning via Model Predictive Shielding

摘要

关键词

相关论文

面向学习与规划的并行可微可达性：具有认证神经动力学与控制器的系统

人工智能增强的智能焊接岛：基础模型革新制造业

基于深度强化学习和动态图神经网络的多任务机器人调度代理

基于微调与AAS增强检索的LLM驱动自动化DFA评估