首页 /研究 /GEM:生成式监督助力具身智能
MANIPULATION开放获取

GEM:生成式监督助力具身智能

Ruowen Zhao, Bangguo Li, Zuyan Liu, Yinan Liang, Junliang Ye, Fangfu Liu, Diankun Wu, Zhengyi Wang, Xumin Yu, Yongming Rao, Han Hu, Jun Zhu

2026

摘要

本文提出GEM模型,通过在视觉语言模型预训练阶段引入深度图生成任务,弥合高层语义与低层空间物理知识之间的鸿沟。实验表明,该方法在多个具身基准上取得最优结果,并显著提升了操作能力。

关键词

embodied intelligencevision-language modeldepth map generationpre-trainingrobotics

相关论文