趋近智
所有课程
2.1 函数近似的简介
2.2 使用神经网络进行Q值近似
2.3 DQN 算法架构
2.4 经验回放机制
2.5 固定Q目标 (目标网络)
2.6 DQN训练的损失函数
2.7 动手实践:在CartPole上实现DQN
© 2025 ApX Machine Learning