LEARNING开放获取
通过多智能体强化学习实现超人安全与敏捷竞速
Ismail Geles, Leonard Bauersfeld, Markus Wulfmeier, Davide Scaramuzza
2026
摘要
本文展示了多智能体强化学习在真实世界高速四旋翼竞速中的有效性,通过联赛自对弈训练智能体掌握复杂气动交互与策略机动,在超过22米/秒的速度下击败人类冠军飞行员,同时将碰撞率降低50%。该方法通过多样化智能体训练实现了与人类安全互动的零样本泛化,表明多智能体交互是鲁棒机器人共存的关键。
关键词
multi-agent reinforcement learningquadrotor racingcollision avoidanceself-playhuman-robot interaction
相关论文
LEARNING
开放获取
点跟踪改进世界动作模型
Jiarui Guan, Wenshuai Zhao, Yue Pei 等 6 位作者
2026
LEARNING
开放获取
面向人形机器人视频模仿学习的直接动态重定向
Constant Roux, Ludovic De Matteïs, Armand Jordana 等 7 位作者
2026
LEARNING
开放获取
Any2Any: 面向人形全身跟踪的高效跨本体迁移
Ming Yang, Tao Yu, Feng Li 等 4 位作者
2026
LEARNING
开放获取
基于视觉的湍急海面敏捷着陆
Dimosthenis Angelis, Leonard Bauersfeld, Davide Scaramuzza 等 4 位作者
2026