Deep Learning, Ian Goodfellow, Yoshua Bengio, and Aaron Courville, 2016 (MIT Press) - 一本基础性教材,提供了深度学习全面的数学和概念背景,其中有专门章节讨论优化、正则化和超参数选择。
Random Search for Hyper-Parameter Optimization, James Bergstra and Yoshua Bengio, 2012Journal of Machine Learning Research, Vol. 13 (JMLR Editorial Board) - 这篇论文首次提出随机搜索,作为比网格搜索更高效的超参数优化方法,尤其在仅部分超参数对性能有显著影响时表现出色。
Practical Bayesian Optimization of Machine Learning Algorithms, Jasper Snoek, Hugo Larochelle, Ryan P. Adams, 2012Advances in Neural Information Processing Systems 25, Vol. 25 (NeurIPS Proceedings) - 一篇有影响力的论文,展示了贝叶斯优化在调整机器学习算法方面的有效性,并提供了其应用的实用建议和经验结果。