首页 /研究 /SalsaAgent:用于交互式舞蹈生成的多模态具身语言模型
HRI

SalsaAgent:用于交互式舞蹈生成的多模态具身语言模型

Payam Jome Yazdian, Zoe Stanley, Angelica Lim

发表年份
2026
访问权限
开放获取

摘要

本文提出SalsaAgent,一种能够根据人类领舞和音乐背景生成全身萨尔萨舞动作的语言模型。通过将交互建模为非语言运动令牌传递,并采用两阶段令牌到扩散管道,该方法在运动质量、音乐与伙伴协调性以及双人空间行为一致性上显著优于基线。

关键词

dance generationmultimodallanguage modelhuman-robot interactionmotion token

相关论文

查看 HRI 分类全部论文