Deep Learning, Ian Goodfellow, Yoshua Bengio, and Aaron Courville, 2016 (MIT Press) - 一本关于深度学习基础概念的综合性教科书,涵盖了正则化技术(L1、L2、Dropout、批量归一化)和优化算法,以及它们的理论基础和实践考量。
Dropout: A Simple Way to Prevent Overfitting Neural Networks, Nitish Srivastava, Geoffrey Hinton, Alex Krizhevsky, Ilya Sutskever, and Ruslan Salakhutdinov, 2014Journal of Machine Learning Research (JMLR), Vol. 15 - 这篇开创性论文介绍了Dropout,详细阐述了它作为一种正则化技术,通过在训练期间随机丢弃单元来防止过拟合的机制,并讨论了其优势。