HRI开放获取
知道该问什么的机器人:通过定向解释恢复未对齐的奖励
Helena Merker, Nick Walker, Andreea Bobu
2026
摘要
本文提出一种框架,通过检测演示中未充分指定的特征,并主动请求针对性的纠正演示来恢复奖励函数。关键创新在于利用特征在演示中的统计变异性识别模糊特征,并通过自然语言解释引导用户提供有效补充数据。
关键词
reward learningactive learningexplanationhuman-robot interactiondemonstration
相关论文
HRI
开放获取
6G通信网络赋能具身智能体:架构与原型
Lipeng Dai, Luping Xiang, Kun Yang
2026
MANIPULATION
开放获取
GesVLA:手势感知的视觉-语言-动作模型嵌入式表示
Wenxuan Guo, Ziyuan Li, Meng Zhang 等 10 位作者
2026
LEARNING
开放获取
通过多智能体强化学习实现超人安全与敏捷竞速
Ismail Geles, Leonard Bauersfeld, Markus Wulfmeier 等 4 位作者
2026