PERCEPTION
ERQA-Plus:具身人工智能推理的诊断基准
Hong Yang, Basura Fernando
- 发表年份
- 2026
- 访问权限
- 开放获取
摘要
ERQA-Plus是一个专门用于评估具身AI推理能力的诊断基准,包含1766个基于机器人视角图像的问题-答案实例,覆盖感知、动作、社交交互、导航和常识推理等多个维度。该基准通过多阶段生成与验证流程构建,旨在区分真正的具身推理与基于视觉或语言模式匹配的捷径。
关键词
embodied AIreasoning benchmarkvision-language modelsdiagnostic evaluationspatial reasoning
相关论文
PERCEPTION
📊 22,245 引用
Artificial intelligence: a modern approach
1995
PERCEPTION
📊 14,348 引用
Are we ready for autonomous driving? The KITTI vision benchmark suite
Andreas Geiger, P Lenz, R. Urtasun
2012
PERCEPTION
开放获取📊 9,777 引用
TensorFlow: Large-Scale Machine Learning on Heterogeneous Distributed Systems
Martı́n Abadi, Ashish Agarwal, Paul Barham 等 20 位作者
2016
PERCEPTION
📊 9,681 引用
Vision meets robotics: The KITTI dataset
Andreas Geiger, Philip Lenz, Christoph Stiller 等 4 位作者
2013