PERCEPTION
优质令牌搜寻:视觉几何变换器中令牌选择的搭车指南
Shuhong Zheng, Michael Oechsle, Erik Sandström, Marie-Julie Rakotosaona, Federico Tombari, Igor Gilitschenski
- 发表年份
- 2026
- 访问权限
- 开放获取
摘要
本文提出了一种两阶段令牌选择框架,通过帧间多样性选择和帧内层感知稀疏化,显著降低视觉几何变换器的计算成本。该方法在保持甚至提升基线性能的同时,将包含500张图像的场景处理速度提升超过85%。
关键词
token selectionvisual geometry transformersmulti-view 3D reconstructionglobal attentionsparsification
相关论文
PERCEPTION
📊 22,245 引用
Artificial intelligence: a modern approach
1995
PERCEPTION
📊 14,348 引用
Are we ready for autonomous driving? The KITTI vision benchmark suite
Andreas Geiger, P Lenz, R. Urtasun
2012
PERCEPTION
开放获取📊 9,777 引用
TensorFlow: Large-Scale Machine Learning on Heterogeneous Distributed Systems
Martı́n Abadi, Ashish Agarwal, Paul Barham 等 20 位作者
2016
PERCEPTION
📊 9,681 引用
Vision meets robotics: The KITTI dataset
Andreas Geiger, Philip Lenz, Christoph Stiller 等 4 位作者
2013