首页 /研究 /用于微调多模态生成策略的行为模式发现
MANIPULATION开放获取

用于微调多模态生成策略的行为模式发现

Alberta Longhini, David Emukpere, Jean-Michel Renders, Seungsu Kim

2026

摘要

本文提出了一种无监督模式发现框架,用于在强化学习微调生成策略时保持行为多样性。实验表明,该方法在机器人操作任务中提高了成功率并保留了更丰富的多模态动作分布。

关键词

reinforcement learningmultimodal policiesbehavioral diversityfine-tuningrobotic manipulation

相关论文