首页 /研究 /知道该问什么的机器人:通过定向解释恢复未对齐的奖励
HRI开放获取

知道该问什么的机器人:通过定向解释恢复未对齐的奖励

Helena Merker, Nick Walker, Andreea Bobu

2026

摘要

本文提出一种框架,通过检测演示中未充分指定的特征,并主动请求针对性的纠正演示来恢复奖励函数。关键创新在于利用特征在演示中的统计变异性识别模糊特征,并通过自然语言解释引导用户提供有效补充数据。

关键词

reward learningactive learningexplanationhuman-robot interactiondemonstration

相关论文