首页 /研究 /ERQA-Plus:具身人工智能推理的诊断基准
PERCEPTION

ERQA-Plus:具身人工智能推理的诊断基准

Hong Yang, Basura Fernando

发表年份
2026
访问权限
开放获取

摘要

ERQA-Plus是一个专门用于评估具身AI推理能力的诊断基准,包含1766个基于机器人视角图像的问题-答案实例,覆盖感知、动作、社交交互、导航和常识推理等多个维度。该基准通过多阶段生成与验证流程构建,旨在区分真正的具身推理与基于视觉或语言模式匹配的捷径。

关键词

embodied AIreasoning benchmarkvision-language modelsdiagnostic evaluationspatial reasoning

相关论文

查看 PERCEPTION 分类全部论文