Reinforcement Learning: An Introduction, Richard S. Sutton, Andrew G. Barto, 2018 (A Bradford Book, The MIT Press) - 强化学习领域的权威教科书,详细阐述了动态规划在通过价值迭代和策略迭代解决马尔可夫决策过程中的应用。
Deep Learning, Ian Goodfellow, Yoshua Bengio, and Aaron Courville, 2016 (MIT Press) - 为深度学习提供了全面的理论和实践基础,涵盖了优化技术(如SGD)和正则化方法(如Dropout),这些都体现了迭代和随机算法。