HRI开放获取📊 0 引用
引导、思考、行动:视觉-语言-动作模型中的交互式具身推理
Yiran Ling, Qing Lian, Jinghang Li, Qing Jiang, Tianming Zhang, Xiaoke Jiang, Chuanxiu Liu, Jie Liu, Lei Zhang
2026
摘要
本文提出GTA-VLA框架,通过允许用户以显式视觉线索引导机器人策略,实现空间可控的具身推理。该框架将外部空间引导与内部任务规划统一为空间-视觉思维链,解决了现有模型在域外偏移和错误纠正方面的局限性。
关键词
vision-language-actionembodied reasoninghuman-robot interactionspatial guidancechain-of-thought
相关论文
HRI
📊 3 引用
工业5.0中人机协作的多模态感知、互认知与具身执行综述与展望
Kai Ding, Qingyuan Mao, Yaqian Zhang 等 6 位作者
Robotics and Computer-Integrated Manufacturing · 2026
HRI
📊 0 引用
迈向以人为中心的制造:人机协作装配中不确定性下的任务规划
Yingchao You, Ze Ji, Changyun Wei
Robotics and Computer-Integrated Manufacturing · 2026
HRI
📊 0 引用
代理式人机协作:通过记忆实现上下文对齐
Jiahui Si, Wenchao Li, Xi Chen 等 7 位作者
Robotics and Computer-Integrated Manufacturing · 2026
HRI
📊 0 引用
自适应物理信息Transformer结合高斯过程残差补偿用于人机协作中的逆动力学建模
Rui Qian, Xi Zhang, Dongpeng Li 等 5 位作者
Robotics and Computer-Integrated Manufacturing · 2026