PERCEPTION
OneCanvas:通过全景重投影实现3D场景理解
Bartłomiej Baranowski, Dave Zhenyu Chen, Matthias Nießner
- 发表年份
- 2026
- 访问权限
- 开放获取
摘要
OneCanvas提出了一种新颖的3D场景表示方法,将所有视角的补丁特征聚合到单个等距柱状全景画布上,无需复杂的几何编码器或大量训练。该方法通过将补丁反投影到3D世界坐标并添加位置嵌入,使预训练的视觉语言模型能够直接处理这种表示,从而支持机器人技术中的情境推理。
关键词
3D scene understandingpanoramic reprojectionvision-language modelsspatial reasoningrobotics
相关论文
PERCEPTION
📊 22,245 引用
Artificial intelligence: a modern approach
1995
PERCEPTION
📊 14,348 引用
Are we ready for autonomous driving? The KITTI vision benchmark suite
Andreas Geiger, P Lenz, R. Urtasun
2012
PERCEPTION
开放获取📊 9,777 引用
TensorFlow: Large-Scale Machine Learning on Heterogeneous Distributed Systems
Martı́n Abadi, Ashish Agarwal, Paul Barham 等 20 位作者
2016
PERCEPTION
📊 9,681 引用
Vision meets robotics: The KITTI dataset
Andreas Geiger, Philip Lenz, Christoph Stiller 等 4 位作者
2013