OTHER开放获取
延迟共享POMDP中分散式团队均衡的私有与公共信息状态:基于动态规划的方法
Charalambos D. Charalambous, Umarbek Guvercin, Seddik Djouadi
2026
摘要
本文基于Witsenhausen的延迟共享信息模式,提出了分散式部分可观测马尔可夫决策过程(POMDP)中最优策略的结构性质,并建立了相应的动态规划方程。通过引入分散式序贯团队均衡概念,该框架将每个智能体的策略优化压缩到其动作空间,实现了类似集中式POMDP动态规划的关键特性。
关键词
decentralized POMDPdelayed sharingdynamic programmingteam equilibriuminformation states
相关论文
OTHER
📊 1 引用
一种面向线弧增材制造的电动汽车结构可制造性拓扑优化的双环框架
Qiang Cui, Chuan Yu, Daoqian Yang 等 5 位作者
Robotics and Computer-Integrated Manufacturing · 2026
OTHER
📊 0 引用
几何数字孪生:一种用于航空发动机装配精度预测的数字智能模型
Ke Shang, Xin Jin, Teli Xu 等 7 位作者
Robotics and Computer-Integrated Manufacturing · 2026
OTHER
📊 0 引用
通过人工智能驱动的机器人技术革新产业
Aryan Chaudhary
Recent Advances in Computer Science and Communications · 2026
OTHER
📊 0 引用
新型大口径偏置馈电可展开天线设计与动态性能预测
Chuang Shi, Tianming Liu, Ning Xue 等 9 位作者
Aerospace Science and Technology · 2026