Home /Research /Optimistic reinforcement learning by forward Kullback–Leibler divergence optimization

LEARNING

Optimistic reinforcement learning by forward Kullback–Leibler divergence optimization

Taisuke Kobayashi

Year: 2022
Citations: 20

Keywords

Reinforcement learningDivergence (linguistics)Computer scienceKullback–Leibler divergenceMathematical optimizationHyperparameterOptimization problemArtificial intelligenceBellman equationMarkov decision process

Optimistic reinforcement learning by forward Kullback–Leibler divergence optimization

Keywords

Related papers

Statistical Learning Theory

Artificial intelligence: a modern approach

Applied Nonlinear Control

A new optimizer using particle swarm theory