Greedy Layer-Wise Training of Deep Networks, Yoshua Bengio, Pascal Lamblin, Dan Popovici, Hugo Larochelle, 2007Advances in Neural Information Processing Systems 19, Vol. 19 - 这项工作进一步阐述并推广了贪婪逐层训练方法,展示了其在预训练包括堆叠自编码器在内的各种深度网络架构方面的有效性。
Deep Learning, Ian Goodfellow, Yoshua Bengio, and Aaron Courville, 2016 (MIT Press) - 这本书提供了深度学习的全面论述,详细解释了堆叠自编码器、贪婪逐层预训练以及它们的历史背景和重要性。