首页 /研究 /OneCanvas：通过全景重投影实现3D场景理解

PERCEPTION

OneCanvas：通过全景重投影实现3D场景理解

Bartłomiej Baranowski, Dave Zhenyu Chen, Matthias Nießner

发表年份: 2026
访问权限: 开放获取

摘要

OneCanvas提出了一种新颖的3D场景表示方法，将所有视角的补丁特征聚合到单个等距柱状全景画布上，无需复杂的几何编码器或大量训练。该方法通过将补丁反投影到3D世界坐标并添加位置嵌入，使预训练的视觉语言模型能够直接处理这种表示，从而支持机器人技术中的情境推理。

关键词

3D scene understandingpanoramic reprojectionvision-language modelsspatial reasoningrobotics

相关论文

PERCEPTION

📊 22,245 引用

Artificial intelligence: a modern approach

1995

PERCEPTION

📊 14,348 引用

Are we ready for autonomous driving? The KITTI vision benchmark suite

Andreas Geiger, P Lenz, R. Urtasun

2012

PERCEPTION

开放获取📊 9,777 引用

TensorFlow: Large-Scale Machine Learning on Heterogeneous Distributed Systems

Martı́n Abadi, Ashish Agarwal, Paul Barham 等 20 位作者

2016

📄 PDF 详情 →

PERCEPTION

📊 9,681 引用

Vision meets robotics: The KITTI dataset

Andreas Geiger, Philip Lenz, Christoph Stiller 等 4 位作者

2013

查看 PERCEPTION 分类全部论文