首页 /研究 /SceneGraphGrounder：通过结构化场景图匹配实现零样本3D视觉定位

PERCEPTION

SceneGraphGrounder：通过结构化场景图匹配实现零样本3D视觉定位

Xuefei Sun, Xujia Zhang, Brendan Crowe, Doncey Albin, Christoffer Heckman

发表年份: 2026
访问权限: 开放获取

摘要

提出一种将3D视觉定位问题转化为结构化图匹配的新框架，通过视觉标记提示从2D视图推断物体关系并构建3D场景图，实现多视角一致且可解释的零样本定位。在ScanRefer基准和真实机器人部署中验证了其有效性。

关键词

zero-shot 3D visual groundingscene graph matchingvision-language model

相关论文

PERCEPTION

📊 22,245 引用

Artificial intelligence: a modern approach

1995

PERCEPTION

📊 14,348 引用

Are we ready for autonomous driving? The KITTI vision benchmark suite

Andreas Geiger, P Lenz, R. Urtasun

2012

PERCEPTION

开放获取📊 9,777 引用

TensorFlow: Large-Scale Machine Learning on Heterogeneous Distributed Systems

Martı́n Abadi, Ashish Agarwal, Paul Barham 等 20 位作者

2016

📄 PDF 详情 →

PERCEPTION

📊 9,681 引用

Vision meets robotics: The KITTI dataset

Andreas Geiger, Philip Lenz, Christoph Stiller 等 4 位作者

2013

查看 PERCEPTION 分类全部论文