DRL论文阅读(三)之DQN改进随机采样(Prioritized Experience Replay)
前言
上一篇介绍了Double DQN对DQN的目标Q值优化,这篇将介绍在DDQN的基础上,对经验回放池的优化
一、论文题目
PRIORITIZED EXPERIENCE REPLAY
二、研究目标
在DDQN基础上,改进经验回放池的均匀随机采样算法,使得学习更高效
三、问题定义
DDQN的
...