PERCEPTION开放获取📊 0 引用
EARL:面向自我中心交互推理与像素定位的统一分析引导强化学习框架
Yuejiao Su, Xinshen Zhang, Zhen Ye, Lei Yao, Lap-Pui Chau, Yi Wang
2026
摘要
本文提出EARL框架,通过分析引导的强化学习将粗粒度交互语义转化为查询导向的答案与像素级定位。该框架采用两阶段解析机制,并设计多面奖励函数优化异构输出,显著提升了自我中心视觉中交互推理与细粒度定位的准确性。
关键词
egocentric visionreinforcement learningpixel groundinginteraction reasoningmultimodal large language models
相关论文
PERCEPTION
📊 0 引用
基于点云配准的非破坏性高分辨率涂层厚度三维扫描测量
Simon Duenser, Ivo Aschwanden, Raamadaas Krishnadas 等 5 位作者
Robotics and Computer-Integrated Manufacturing · 2026
PERCEPTION
📊 0 引用
基于原型模糊推理与证据融合的不确定性引导工业机器人可进化识别框架
Yanrun Zhou, Zihao Lei, Guangrui Wen 等 7 位作者
Robotics and Computer-Integrated Manufacturing · 2026
MANIPULATION
📊 0 引用
PAEAR:基于强化学习的点云区域探索与主动识别方法用于机器人焊接
Yong Tao, Donghua Tan, Fan Ren 等 9 位作者
Robotics and Computer-Integrated Manufacturing · 2026
PERCEPTION
📊 0 引用
迈向智能机器人时代:用于高级感知系统的多模态柔性触觉传感器
Sili Ding, Feng Xu, Jie Chen 等 6 位作者
Progress in Materials Science · 2026