首页 /研究 /OneCanvas:通过全景重投影实现3D场景理解
PERCEPTION

OneCanvas:通过全景重投影实现3D场景理解

Bartłomiej Baranowski, Dave Zhenyu Chen, Matthias Nießner

发表年份
2026
访问权限
开放获取

摘要

OneCanvas提出了一种新颖的3D场景表示方法,将所有视角的补丁特征聚合到单个等距柱状全景画布上,无需复杂的几何编码器或大量训练。该方法通过将补丁反投影到3D世界坐标并添加位置嵌入,使预训练的视觉语言模型能够直接处理这种表示,从而支持机器人技术中的情境推理。

关键词

3D scene understandingpanoramic reprojectionvision-language modelsspatial reasoningrobotics

相关论文

查看 PERCEPTION 分类全部论文