趋近智

所有课程

深度学习入门

章节 1: 神经网络基本原理

从机器学习到深度学习

生物学上的启发：神经元

人工神经元：数学模型

感知机：最简单的神经网络

单层感知器的局限性

多层感知机 (MLP)：添加层次

动手实践：构建一个简单的感知器模型

章节 2: 激活函数与网络结构

激活函数的作用

Sigmoid 激活函数

双曲正切（Tanh）激活函数

修正线性单元 (ReLU)

ReLU的多种形式 (Leaky ReLU, PReLU, ELU)

选择合适的激活函数

理解网络层：输入层、隐藏层、输出层

设计前馈网络架构

动手实践：实现不同的激活函数

章节 3: 训练神经网络：损失与优化

衡量表现：损失函数

常见的回归损失函数 (MSE, MAE)

用于分类的常用损失函数（交叉熵）

优化：寻找最优权重

梯度下降算法

随机梯度下降 (SGD)

梯度下降的难题

动手实践：梯度下降可视化

章节 4: 反向传播和高级优化

计算梯度：链式法则

反向传播算法详解

前向传播与反向传播

带有动量的梯度下降

RMSprop 优化器

选择优化算法

动手实践：反向传播逐步解析

章节 5: 搭建与训练深度神经网络

深度学习框架简介 (TensorFlow/Keras, PyTorch)

搭建开发环境

神经网络的数据准备

定义一个前馈网络模型

权重初始化方法

配置模型：损失函数与优化器选择

模型训练：fit 方法

监控训练进展（损失与指标）

模型性能评估

动手实践：在MNIST上训练分类器

章节 6: 正则化与性能提升

过拟合问题

正则化方法概述

L1 和 L2 正则化

Dropout正则化

超参数调整基本原理

超参数搜索策略（网格搜索、随机搜索）

实践操作：运用Dropout和Early Stopping

章节 7: 专用架构介绍

前馈网络的局限性

卷积神经网络 (CNNs): 动因

CNN核心操作：卷积

CNN核心操作：池化

典型CNN架构

循环神经网络（RNN）：缘由

循环与隐藏状态

基本RNN架构

简单循环神经网络的挑战 (梯度消失/梯度爆炸)

概述：LSTM与GRU

Sigmoid 激活函数

这部分内容有帮助吗？

参考文献

Deep Learning, Ian Goodfellow, Yoshua Bengio, and Aaron Courville, 2016 (MIT Press) - 全面解释了激活函数，包括 Sigmoid 函数的特性、历史背景以及深度网络中梯度消失问题。
Lecture Notes on Neural Networks Part 1: Setting up the Architecture, Andrej Karpathy, Justin Johnson, and Serena Yeung, 2023 Stanford University CS231n Course Notes - 提供了神经网络架构的入门介绍，涵盖了 Sigmoid 等激活函数、它们的优点以及梯度消失和非零中心输出等关键缺点。
torch.sigmoid, PyTorch Developers, 2023 (PyTorch Foundation) - PyTorch 深度学习框架中 Sigmoid 激活函数的官方文档，详细说明了其函数式和基于模块的使用方法，便于实际实现。

© 2025 ApX Machine Learning