首页 /研究 /ProcVLM:基于程序化进度奖励的机器人操作学习
MANIPULATION开放获取

ProcVLM:基于程序化进度奖励的机器人操作学习

Youhe Feng, Hansen Shi, Haoyang Li, Xinlei Guo, Yang Wang, Chengyang Zhang, Jinkai Zhang, Xiaohan Zhang, Jie Tang, Jing Zhang

2026

摘要

本文提出ProcVLM,一种利用程序化进度作为密集奖励信号的视觉语言模型,用于长时域机器人操作任务。通过合成帧级子任务语义标注并基于子任务结构分配进度预算,模型能更准确地反映任务实际进展而非仅依赖时间或最终结果。

关键词

progress rewardvision-language modellong-horizon manipulationdense feedbacksubtask segmentation

相关论文