LEARNING开放获取
面向随机丢包非线性系统的自适应无模型最优控制:演员-辨识器-评论家强化学习方法
Kianoush Aqabakee, Kosar Behnia, Amirhossein Heydarian Ardakani, Farzaneh Abdollahi, Elham Shiraz
2026
摘要
本文提出了一种演员-辨识器-评论家(AIC)控制器,用于在控制器到执行器及传感器到控制器通道存在丢包的情况下实现非线性系统的无模型跟踪控制。通过辨识器学习系统动态,该控制器能处理通信链路中的丢包,并在无模型控制框架内促进评论家到演员的梯度传播。
关键词
reinforcement learningpacket dropoutsnonlinear controlmodel-freeactor-critic
相关论文
LEARNING
开放获取📊 1 引用
面向学习与规划的并行可微可达性:具有认证神经动力学与控制器的系统
Keyi Shen, Glen Chou
2026
LEARNING
📊 0 引用
基于深度强化学习和动态图神经网络的多任务机器人调度代理
Hedi Boukamcha, Anas Neumann, Monia Rekik 等 6 位作者
Robotics and Computer-Integrated Manufacturing · 2026
LEARNING
📊 0 引用
人工智能增强的智能焊接岛:基础模型革新制造业
Xiwei Wu, Wei Wu, Qiqi Chen 等 9 位作者
Robotics and Computer-Integrated Manufacturing · 2026
MANIPULATION
📊 0 引用
PAEAR:基于强化学习的点云区域探索与主动识别方法用于机器人焊接
Yong Tao, Donghua Tan, Fan Ren 等 9 位作者
Robotics and Computer-Integrated Manufacturing · 2026