首页 /研究 /基于强化学习的集装箱卸货:拣选顺序、死锁避免及概念验证仿真
MANIPULATION开放获取📊 0 引用

基于强化学习的集装箱卸货:拣选顺序、死锁避免及概念验证仿真

Jan Rüdiger, Max Schenke, Daniel Weber

2026

摘要

本文研究了使用强化学习在集装箱卸货场景中学习物品选择策略的潜力。通过创建仿真环境并实现掩码深度Q学习,智能体达到了60%的平均成功率,显著优于随机策略的20%。

关键词

reinforcement learningcontainer unloadingitem selectionsimulationdeep Q-learning

相关论文