首页 /研究 /R2R2:通过自预测学习中的冗余减少实现密集经验复用的鲁棒表示
LEARNING开放获取

R2R2:通过自预测学习中的冗余减少实现密集经验复用的鲁棒表示

Sanghyeob Song, Donghyeok Lee, Jinsik Kim, Sungroh Yoon

2026

摘要

本文提出了一种名为R2R2的正则化方法,用于解决自预测学习在高更新-数据比下的过拟合问题。实验表明,该方法在11个连续控制任务中有效提升了性能,并可与现有先进算法正交结合。

关键词

reinforcement learningself-predictive learningoverfittingredundancy reductioncontinuous control

相关论文