HRI
Gaze2Act:基于注视条件的视觉-语言-行动策略用于交互式机器人操作
Kuangji Zuo, Gen Li, Bofan Lyu, Yanshuo Lu, Boyu Ma, Shijia Han, Xinyu Zhou, Xichen Yuan, Chuhao Zhou, Jiaqi Bai, Geng Li, Jianfei Yang
- 发表年份
- 2026
- 访问权限
- 开放获取
摘要
本文提出Gaze2Act框架,通过人类注视作为动态意图信号,结合跨视角语义匹配将第一人称注视映射到机器人视角,实现粗到细的目标指定。在Unitree G1人形机器人上的16项真实任务中,该方法在意图准确率和任务成功率上均达到最先进水平。
关键词
human gazeVLAintent specificationinteractive manipulationhumanoid
相关论文
HRI
📊 3 引用
工业5.0中人机协作的多模态感知、互认知与具身执行综述与展望
Kai Ding, Qingyuan Mao, Yaqian Zhang 等 6 位作者
Robotics and Computer-Integrated Manufacturing · 2026
HRI
📊 0 引用
迈向以人为中心的制造:人机协作装配中不确定性下的任务规划
Yingchao You, Ze Ji, Changyun Wei
Robotics and Computer-Integrated Manufacturing · 2026
HRI
📊 0 引用
代理式人机协作:通过记忆实现上下文对齐
Jiahui Si, Wenchao Li, Xi Chen 等 7 位作者
Robotics and Computer-Integrated Manufacturing · 2026
HRI
📊 0 引用
自适应物理信息Transformer结合高斯过程残差补偿用于人机协作中的逆动力学建模
Rui Qian, Xi Zhang, Dongpeng Li 等 5 位作者
Robotics and Computer-Integrated Manufacturing · 2026