打破认知陷阱：复合不确定性下的主动感知

Chayan Banerjee, Ethan Goan

摘要

本文指出安全关键领域强化学习失败的根本原因是动态变化与观测不完整之间的协同交互，即“认知陷阱”。通过模拟实验证明复合不确定性导致77%的性能下降，并提出基于互信息的自适应安全架构来量化并解决这一问题。

reinforcement learningepistemic trapcompound uncertaintyadaptive safetymutual information

LEARNING

📊 8,465 引用

D. O. Hebb

2005

LEARNING

📊 7,678 引用

Benoît B. Mandelbrot, John W. Van Ness

1968

LEARNING

开放获取📊 7,484 引用

Laith Alzubaidi, Jinglan Zhang, Amjad J. Humaidi 等 10 位作者

2021

LEARNING

📊 4,608 引用

Andre Esteva, Alexandre Robicquet, Bharath Ramsundar 等 10 位作者

2018