首页 /研究 /SceneGraphGrounder:通过结构化场景图匹配实现零样本3D视觉定位
PERCEPTION开放获取

SceneGraphGrounder:通过结构化场景图匹配实现零样本3D视觉定位

Xuefei Sun, Xujia Zhang, Brendan Crowe, Doncey Albin, Christoffer Heckman

2026

摘要

提出一种将3D视觉定位问题转化为结构化图匹配的新框架,通过视觉标记提示从2D视图推断物体关系并构建3D场景图,实现多视角一致且可解释的零样本定位。在ScanRefer基准和真实机器人部署中验证了其有效性。

关键词

zero-shot 3D visual groundingscene graph matchingvision-language model

相关论文