LOCOMOTION开放获取📊 0 引用
学习平衡电机热安全与四足运动性能的残差策略
Yuhang Wan, Weixian Lin, Letian Qian, Yiqi Zou, Weiwei Wu, Shengwei Wu, Chuanlin Zhao, Xin Luo
2026
摘要
本文提出一个两阶段训练框架,先预训练标称策略作为运动基线,再训练残差策略根据热状态修正动作,以平衡电机热安全与运动性能。仿真和真实实验表明,该策略在3kg负载下使机器人稳定运动超过13分钟,而标称策略仅约5分钟即过热。
关键词
quadrupedal locomotionmotor thermal managementresidual policyreinforcement learningthermal safety
相关论文
LOCOMOTION
开放获取📊 0 引用
一种具有闩锁介导的软体双稳态机构的仿生水下机器人
Chongze Bi, Wenjie Wu, Zonghao Zuo 等 4 位作者
2026
PERCEPTION
开放获取
FoundObj: 自监督基础模型作为无标签3D目标分割的奖励
Zihui Zhang, Zhixuan Sun, Yafei Yang 等 6 位作者
2026
LEARNING
开放获取
比率方差正则化策略优化
Yu Luo, Shuo Han, Yihan Hu 等 8 位作者
2026
MANIPULATION
开放获取
EXPO-FT: 面向视觉-语言-动作模型的样本高效强化学习微调
Perry Dong, Kuo-Han Hung, Tian Gao 等 5 位作者
2026