LOCOMOTION开放获取
ChainFlow-VLA:基于视觉语言模型的因果流规划
Xiyang Wang, Xinlin Wang, Tingguang Zhou, Gong Chen, Xingtai Gui, Zhi Xu, Xiaolei Wu, Feiyang Tan, Hangning Zhou, Mu Yang
2026
摘要
本文提出ChainFlow-VLA框架,通过将自回归因果生成与扩散全局优化统一于一个概率框架中,解决了自动驾驶中时序因果推理与全局轨迹一致性的矛盾。该方法利用自回归生成器产生因果轨迹模式,再通过扩散精炼器结合视觉语言模型隐状态进行残差校正,在保持因果结构的同时实现全局优化。
关键词
autonomous drivingcausal flow planningvision-language modelsautoregressive generationdiffusion refinement
相关论文
LOCOMOTION
开放获取
基于增量可达图与结构先验的地面机器人多楼层探索
Zhiwen Zhu, Jiaqi Chen, Xiangyi Huang 等 5 位作者
2026
PERCEPTION
开放获取
ArchSIBench: 视觉语言模型建筑空间智能基准测试
Qirui Shen, Wenda Wang, Jiachen Lu 等 8 位作者
2026
PERCEPTION
开放获取
Yes-Man综合征:具身机器人代理中的弃权行为基准测试
Doguhan Yeke, Elif Su Temirel, Ananth Shreekumar 等 6 位作者
2026