首页 /研究 /优质令牌搜寻:视觉几何变换器中令牌选择的搭车指南
PERCEPTION

优质令牌搜寻:视觉几何变换器中令牌选择的搭车指南

Shuhong Zheng, Michael Oechsle, Erik Sandström, Marie-Julie Rakotosaona, Federico Tombari, Igor Gilitschenski

发表年份
2026
访问权限
开放获取

摘要

本文提出了一种两阶段令牌选择框架,通过帧间多样性选择和帧内层感知稀疏化,显著降低视觉几何变换器的计算成本。该方法在保持甚至提升基线性能的同时,将包含500张图像的场景处理速度提升超过85%。

关键词

token selectionvisual geometry transformersmulti-view 3D reconstructionglobal attentionsparsification

相关论文

查看 PERCEPTION 分类全部论文