Deep Learning, Ian Goodfellow, Yoshua Bengio, Aaron Courville, 2016 (MIT Press) - 一本全面的深度学习教科书,涵盖了深度学习的理论基础和实践方面,包括对循环神经网络和梯度消失/爆炸问题的详细解释。
On the difficulty of training recurrent neural networks, Razvan Pascanu, Tomas Mikolov, Yoshua Bengio, 2013Proceedings of the 30th International Conference on Machine Learning, Vol. 28 (PMLR) - 这篇论文深入探讨了循环神经网络中的梯度消失和爆炸问题,并提出了诸如梯度裁剪等实际解决方案,以实现稳定的训练。