首页 /研究 /面向随机丢包非线性系统的自适应无模型最优控制:演员-辨识器-评论家强化学习方法
LEARNING开放获取

面向随机丢包非线性系统的自适应无模型最优控制:演员-辨识器-评论家强化学习方法

Kianoush Aqabakee, Kosar Behnia, Amirhossein Heydarian Ardakani, Farzaneh Abdollahi, Elham Shiraz

2026

摘要

本文提出了一种演员-辨识器-评论家(AIC)控制器,用于在控制器到执行器及传感器到控制器通道存在丢包的情况下实现非线性系统的无模型跟踪控制。通过辨识器学习系统动态,该控制器能处理通信链路中的丢包,并在无模型控制框架内促进评论家到演员的梯度传播。

关键词

reinforcement learningpacket dropoutsnonlinear controlmodel-freeactor-critic

相关论文