趋近智
所有课程
6.1 深度学习损失曲面的特点
6.2 网络架构对优化的影响
6.3 规范化方法与优化
6.4 梯度裁剪与梯度爆炸/消失
6.5 初始化方法及其影响
6.6 正则化方法:优化过程的隐性作用
6.7 实践:深度网络优化器调优
© 2025 ApX Machine Learning