首页 /研究 /X4Val:学习用于方差缩减策略评估的神经替代模型
LEARNING

X4Val:学习用于方差缩减策略评估的神经替代模型

Rachel Luo, Michael Watson, Apoorva Sharma, Heng Yang, Han Qi, Edward Schmerling, Sushant Veer, Boris Ivanovic, Marco Pavone

发表年份
2026
访问权限
开放获取

摘要

本文提出X4Val框架,通过将真实域和辅助域样本嵌入共享表示空间并学习可迁移的预测器,实现非配对多域数据下的方差缩减策略评估。该方法利用仿真、历史日志等廉价辅助数据,显著降低真实世界指标估计的方差。

关键词

policy evaluationvariance reductionsurrogate modelmulti-domain datarobotics evaluation

相关论文

查看 LEARNING 分类全部论文