首页 /研究 /Colosseum V2：视觉语言动作模型泛化能力基准测试

MANIPULATION

Colosseum V2：视觉语言动作模型泛化能力基准测试

Jeremy Morgan, Prajwal Vijay, Hyeonho Oh, Jincen Song, Ashvin Arora, Alina Du, Gaurav Sukhatme, Jesse Thomason, Ishika Singh

发表年份: 2026
访问权限: 开放获取

摘要

本文提出了Colosseum V2，一个用于评估机器人操作中视觉语言动作模型泛化能力的大规模仿真基准。该基准包含28个任务，覆盖多种操作原语和长时域行为，揭示了当前模型在分布偏移下性能下降的局限性。

关键词

benchmarkgeneralizationvision-language-actionsimulationrobot manipulation

相关论文

MANIPULATION

📊 7,533 引用

Real-Time Obstacle Avoidance for Manipulators and Mobile Robots

Oussama Khatib

1986

MANIPULATION

📊 6,720 引用

A Mathematical Introduction to Robotic Manipulation

Richard M. Murray, Zexiang Li, Shankar Sastry

2017

MANIPULATION

📊 3,821 引用

Robot dynamics and control

Mark W. Spong

1989

MANIPULATION

📊 3,499 引用

A tutorial on visual servo control

Seth Hutchinson, Gregory D. Hager, Peter Corke

1996

查看 MANIPULATION 分类全部论文