所有课程

深度学习入门

章节 1: 神经网络基本原理

从机器学习到深度学习

生物学上的启发：神经元

人工神经元：数学模型

感知机：最简单的神经网络

单层感知器的局限性

多层感知机 (MLP)：添加层次

动手实践：构建一个简单的感知器模型

第 1 章测验

章节 2: 激活函数与网络结构

激活函数的作用

Sigmoid 激活函数

双曲正切（Tanh）激活函数

修正线性单元 (ReLU)

ReLU的多种形式 (Leaky ReLU, PReLU, ELU)

选择合适的激活函数

理解网络层：输入层、隐藏层、输出层

设计前馈网络架构

动手实践：实现不同的激活函数

第 2 章测验

章节 3: 训练神经网络：损失与优化

衡量表现：损失函数

常见的回归损失函数 (MSE, MAE)

用于分类的常用损失函数（交叉熵）

优化：寻找最优权重

梯度下降算法

随机梯度下降 (SGD)

梯度下降的难题

动手实践：梯度下降可视化

第 3 章测验

章节 4: 反向传播和高级优化

计算梯度：链式法则

反向传播算法详解

前向传播与反向传播

带有动量的梯度下降

RMSprop 优化器

选择优化算法

动手实践：反向传播逐步解析

第 4 章测验

章节 5: 搭建与训练深度神经网络

深度学习框架简介 (TensorFlow/Keras, PyTorch)

搭建开发环境

神经网络的数据准备

定义一个前馈网络模型

权重初始化方法

配置模型：损失函数与优化器选择

模型训练：fit 方法

监控训练进展（损失与指标）

模型性能评估

动手实践：在MNIST上训练分类器

第 5 章测验

章节 6: 正则化与性能提升

过拟合问题

正则化方法概述

L1 和 L2 正则化

Dropout正则化

超参数调整基本原理

超参数搜索策略（网格搜索、随机搜索）

实践操作：运用Dropout和Early Stopping

第 6 章测验

章节 7: 专用架构介绍

前馈网络的局限性

卷积神经网络 (CNNs): 动因

CNN核心操作：卷积

CNN核心操作：池化

典型CNN架构

循环神经网络（RNN）：缘由

循环与隐藏状态

基本RNN架构

简单循环神经网络的挑战 (梯度消失/梯度爆炸)

概述：LSTM与GRU

第 7 章测验

早期停止

这部分内容有帮助吗？

参考文献

Deep Learning, Ian Goodfellow, Yoshua Bengio, and Aaron Courville, 2016 (MIT Press) - 对早停这一正则化方法提供了全面的理论和实践概览。
Early Stopping-But When?, Lutz Prechelt, 1998 Neural Networks: Tricks of the Trade (Springer Berlin Heidelberg) DOI: 10.1007/3-540-69043-4_5 - 一篇里程碑式的著作，讨论了神经网络训练中早停的理想停止点和实际考量。此为《神经网络：技艺窍门》一书中的一个章节。
tf.keras.callbacks.EarlyStopping, TensorFlow Team, 2024 - 官方文档，详细说明了Keras深度学习框架中早停的实际实现，包括“耐心”等参数。

© 2026 ApX Machine Learning用心打造