MANIPULATION
我们究竟在机器人操作基准测试中衡量什么?
Tianchong Jiang, Xiangshan Tan, Samuel Wheeler, Luzhe Sun, Tewodros W. Ayalew, Matthew Walter
- 发表年份
- 2026
- 引用次数
- 0
- 访问权限
- 开放获取
摘要
本文指出机器人操作基准测试存在四种失效模式,包括捷径可解性、缺乏统计显著性、渐进过拟合和数据源依赖,并提出相应的诊断方法。通过对多个流行基准的审计,发现许多声称的进展缺乏统计支持,且小模型在部分基准上可达到或接近最先进水平。
关键词
benchmark auditingmanipulationfailure modesstatistical significanceoverfitting
相关论文
MANIPULATION
📊 2 引用
面向大型复杂构件的移动机器人辅助磨削技术综述
Yusen Li, Ziwei Wang, Xiangye Zhu 等 12 位作者
Robotics and Computer-Integrated Manufacturing · 2026
MANIPULATION
📊 1 引用
基于物理信息与机器学习的五轴铣削TC4钛合金刀具磨损融合预测模型
Shaoqing Qin, Lida Zhu, Yanpeng Hao 等 10 位作者
Robotics and Computer-Integrated Manufacturing · 2026
MANIPULATION
📊 0 引用
机器人制造中的柔顺操作:理论、技术、应用与趋势
Xu Tang, Jixiang Yang, Han Ding
Robotics and Computer-Integrated Manufacturing · 2027
MANIPULATION
📊 0 引用
一种面向重载多自由度成形机器人的最小能耗全局-局部轨迹优化新方法
Xinghui Han, Xin Chen, Fangyan Zheng 等 5 位作者
Robotics and Computer-Integrated Manufacturing · 2026