首页 /研究 /打破认知陷阱:复合不确定性下的主动感知
LEARNING开放获取

打破认知陷阱:复合不确定性下的主动感知

Chayan Banerjee, Ethan Goan

2026

摘要

本文指出安全关键领域强化学习失败的根本原因是动态变化与观测不完整之间的协同交互,即“认知陷阱”。通过模拟实验证明复合不确定性导致77%的性能下降,并提出基于互信息的自适应安全架构来量化并解决这一问题。

关键词

reinforcement learningepistemic trapcompound uncertaintyadaptive safetymutual information

相关论文