首页 /研究 /共同视界:基于多模态大语言模型的多机器人协作自我中心空间推理
PERCEPTION开放获取

共同视界:基于多模态大语言模型的多机器人协作自我中心空间推理

Kunyu Peng, Zhikun Zhou, Kailun Yang, Di Wen, Ruiping Liu, Yufan Chen, Junwei Zheng, Hao Shi, Yi Zhou, M. Saquib Sarfraz, Danda Pani Paudel, Luc Van Gool

2026

摘要

本文研究了多机器人协作动态空间推理问题,提出了CoopSR基准和EgoTeam数据集,包含超过11万个问答对。同时设计了SP-CoR框架,结合动力学感知采样、光谱物理引导视图融合和物理对齐提示蒸馏,实现了细粒度的协作空间推理。

关键词

多机器人协作空间推理多模态大语言模型自我中心视频基准数据集

相关论文