首页 /研究 /EARL:面向自我中心交互推理与像素定位的统一分析引导强化学习框架
PERCEPTION开放获取📊 0 引用

EARL:面向自我中心交互推理与像素定位的统一分析引导强化学习框架

Yuejiao Su, Xinshen Zhang, Zhen Ye, Lei Yao, Lap-Pui Chau, Yi Wang

2026

摘要

本文提出EARL框架,通过分析引导的强化学习将粗粒度交互语义转化为查询导向的答案与像素级定位。该框架采用两阶段解析机制,并设计多面奖励函数优化异构输出,显著提升了自我中心视觉中交互推理与细粒度定位的准确性。

关键词

egocentric visionreinforcement learningpixel groundinginteraction reasoningmultimodal large language models

相关论文