Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto, 2018 (MIT Press) - 这本广泛使用的教科书涵盖了强化学习的基本概念,包括Q学习、贝尔曼方程,并清晰地解释了这些原理如何应用于深度Q网络。
Spinning Up in Deep RL, Josh Achiam, 2018 - 这个在线资源提供了深度强化学习的实践介绍,详细解释了DQN算法、其损失函数和训练方法,并提供示例。