首页 /研究 /<i>SUB-PLAY:</i> Adversarial Policies against Partially Observed Multi-Agent Reinforcement Learning Systems

SWARM

<i>SUB-PLAY:</i> Adversarial Policies against Partially Observed Multi-Agent Reinforcement Learning Systems

Oubo Ma, Yuwen Pu, Linkang Du, Yang Dai, Ruo Wang, Xiaolei Liu, Yingcai Wu, Shouling Ji

发表年份: 2024
引用次数: 6
访问权限: 开放获取

摘要

Recent advancements in multi-agent reinforcement learning (MARL) have opened up vast application prospects, such as swarm control of drones, collaborative manipulation by robotic arms, and multi-target encirclement. However, potential security threats during the MARL deployment need more attention and thorough investigation. Recent research reveals that attackers can rapidly exploit the victim's vulnerabilities, generating adversarial policies that result in the failure of specific tasks. For instance, reducing the winning rate of a superhuman-level Go AI to around 20%. Existing studies predominantly focus on two-player competitive environments, assuming attackers possess complete global state observation.

关键词

Adversarial systemReinforcement learningExploitSoftware deploymentComputer scienceComputer securityDroneFocus (optics)State (computer science)Artificial intelligence

<i>SUB-PLAY:</i> Adversarial Policies against Partially Observed Multi-Agent Reinforcement Learning Systems

摘要

关键词

相关论文

Statistical Learning Theory

Artificial intelligence: a modern approach

Applied Nonlinear Control

A new optimizer using particle swarm theory