基于势引导的流匹配用于视觉-语言-动作策略改进

Yunpeng Mei, Jiakai He, Hongjie Cao, Chenyu Wang, Xiaowen Zhu, Yihan Zhou, Jiamin Wang, Chenbo Xin, Peng Cheng, Yuxuan Yang, Yijie Wang, Xinhu Zheng, Gao Huang, Jie Chen, Gang Wang

发表年份: 2026
访问权限: 开放获取

摘要

本文提出ForesightFlow，一种自引导的流匹配策略，通过解耦优势加权流匹配方法，在不依赖外部评论家的情况下实现动作块的最佳K推理。该方法解决了策略改进与价值校准之间的监督冲突，显著提升了视觉-语言-动作策略的部署性能。

关键词

flow matchingvision-language-actionpolicy improvementadvantage weightingbest-of-K inference

基于势引导的流匹配用于视觉-语言-动作策略改进

摘要

关键词

相关论文

The Organization of Behavior

Fractional Brownian Motions, Fractional Noises and Applications

Review of deep learning: concepts, CNN architectures, challenges, applications, future directions

A guide to deep learning in healthcare