Deep Learning, Ian Goodfellow, Yoshua Bengio, and Aaron Courville, 2016 (MIT Press) - 一本基础教材,全面介绍了优化挑战,包括深度学习背景下的局部最小值和鞍点。
The Loss Surfaces of Multilayer Networks, Anna Choromanska, Mikael Henaff, Michael Mathieu, Gerard Ben Arous, Yann LeCun, 2015Proceedings of Machine Learning Research, Vol. 38 (Proceedings of Machine Learning Research) - 本文讨论了深度神经网络中损失曲面的特性,指出许多局部最小值在性能上可能等价,这影响了人们对深度模型中局部最小值问题的看法。