LOCOMOTION开放获取
可视化运动策略中的潜在相位结构:基于时间特征扩展的多环境研究
Daisuke Yasui, Toshitaka Matuki, Hiroshi Sato
2026
摘要
本文提出了一种从深度强化学习训练的运动控制策略中揭示潜在运动相位结构的框架,通过扩展聚类特征(包括动作、下一状态和下一动作)并引入抑制自转移的聚类数确定方法。在Ant、HalfCheetah和Walker2D三个环境中验证了该方法能比现有方法识别出更清晰、更具规律性的相位转换规则。
关键词
locomotionreinforcement learningphase structurevisualizationMuJoCo
相关论文
MANIPULATION
📊 0 引用
PAEAR:基于强化学习的点云区域探索与主动识别方法用于机器人焊接
Yong Tao, Donghua Tan, Fan Ren 等 9 位作者
Robotics and Computer-Integrated Manufacturing · 2026
MANIPULATION
📊 0 引用
基于因果强化学习的薄壁零件变形控制多道次切削参数优化
Fengyi Lu, Guanghui Zhou, Chao Zhang 等 5 位作者
Robotics and Computer-Integrated Manufacturing · 2026
LOCOMOTION
📊 0 引用
仿生水下机器人:材料、设计、控制与应用进展
Dilip Muchhala, Pramod Kumar Maurya, Adarsh Raut 等 6 位作者
Robotics and Autonomous Systems · 2026
LOCOMOTION
📊 0 引用
基于非线性滑模模型预测控制与自适应跟随转向及动静态约束的六轮独立驱动/四轮独立转向无人地面车辆轨迹跟踪控制
Shengyang Lu, Guanpeng Chen, Lijing Zhao 等 5 位作者
Robotics and Autonomous Systems · 2026