首页 /研究 /可视化运动策略中的潜在相位结构：基于时间特征扩展的多环境研究

LOCOMOTION

可视化运动策略中的潜在相位结构：基于时间特征扩展的多环境研究

Daisuke Yasui, Toshitaka Matuki, Hiroshi Sato

发表年份: 2026
访问权限: 开放获取

摘要

本文提出了一种从深度强化学习训练的运动控制策略中揭示潜在运动相位结构的框架，通过扩展聚类特征（包括动作、下一状态和下一动作）并引入抑制自转移的聚类数确定方法。在Ant、HalfCheetah和Walker2D三个环境中验证了该方法能比现有方法识别出更清晰、更具规律性的相位转换规则。

关键词

locomotionreinforcement learningphase structurevisualizationMuJoCo

相关论文

LOCOMOTION

开放获取📊 3,141 引用

Trust Region Policy Optimization

John Schulman, Sergey Levine, Philipp Moritz 等 5 位作者

2015

📄 PDF 详情 →

LOCOMOTION

📊 2,724 引用

Legged Robots That Balance

Marc H. Raibert, Ernest R. Tello

1986

LOCOMOTION

📊 2,658 引用

Being there: putting brain, body, and world together again

1997

LOCOMOTION

📊 2,305 引用

Small-scale soft-bodied robot with multimodal locomotion

Wenqi Hu, Guo Zhan Lum, Massimo Mastrangeli 等 4 位作者

2018

查看 LOCOMOTION 分类全部论文