首页 /研究 /WarmPrior:利用时间先验拉直流匹配策略
MANIPULATION开放获取

WarmPrior:利用时间先验拉直流匹配策略

Sinjae Kang, Chanyoung Kim, Kaixin Wang, Li Zhao, Kimin Lee

2026

摘要

本文提出WarmPrior,一种基于近期动作历史构建的简单时间先验,替代标准高斯源分布,能持续提升机器人操作任务的成功率。该方法通过生成更直的概率路径,在行为克隆和强化学习中均表现出显著改进。

关键词

generative policyflow matchingtemporal priorrobot manipulationbehavior cloning

相关论文