PERCEPTION开放获取
ArchSIBench: 视觉语言模型建筑空间智能基准测试
Qirui Shen, Wenda Wang, Jiachen Lu, Zilong Huang, Jin Bai, Lei He, Hongxuan Chen, Weixin Huang
2026
摘要
提出了ArchSIBench基准,从建筑学、认知科学和心理学角度评估视觉语言模型在建筑空间感知、推理、导航、变换和配置五个核心维度的能力。通过专家标注的3000个问答对,发现现有模型在建筑空间智能上与人类基线存在显著差异。
关键词
architectural spatial intelligencebenchmarkvision-language modelsspatial cognition
相关论文
PERCEPTION
开放获取
优质令牌搜寻:视觉几何变换器中令牌选择的搭车指南
Shuhong Zheng, Michael Oechsle, Erik Sandström 等 6 位作者
2026
PERCEPTION
开放获取
SFG-ROS:面向密集多智能体感知的资源感知框架
Constantin Blessing, Elias Geiger, Jakob Häringer 等 5 位作者
2026
PERCEPTION
开放获取
基于深度点对应的无靶标相机-激光雷达内外参联合标定
Simon Bultmann, Daniele Cattaneo, Abhinav Valada
2026
LOCOMOTION
开放获取
ChainFlow-VLA:基于视觉语言模型的因果流规划
Xiyang Wang, Xinlin Wang, Tingguang Zhou 等 10 位作者
2026