章节 6: Flux.jl 深度学习入门

本章将介绍深度学习 (deep learning)的原理以及如何使用 Julia 的主要深度学习库 Flux.jl 来实现它们。在您对机器学习 (machine learning)的认识基础上，我们将侧重于神经网络 (neural network)。这类模型在图像识别和自然语言处理等技术中推动了显著进步。

您将学到：

回顾神经网络的基本组成部分，例如层、Sigmoid 激活函数 (activation function) $\sigma(x) = \frac{1}{1 + e^{-x}}$ ，以及常见结构。
上手使用 Flux.jl，了解其核心数据结构，例如张量，以及如何定义网络层。
构建前馈神经网络。
定义恰当的损失函数 (loss function)，例如均方误差 $L = \frac{1}{N}\sum_{i=1}^{N}(y_i - \hat{y}_i)^2$ ，并选择用于训练的优化器。
理解训练循环，包括前向传播、反向传播 (backpropagation)和权重 (weight)更新。
学习 Zygote.jl 自动微分，这是一个让 Flux.jl 中基于梯度的优化得以实现的组成部分。
在模型训练过程中处理梯度。

在本章结束时，您将能够使用 Flux.jl 在 Julia 中构建和训练基础的神经网络模型。

课程章节

6.1 神经网络基本原理
6.2 Flux.jl 入门：张量与层
6.3 构建前馈神经网络
6.4 定义损失函数与优化器
6.5 在 Flux.jl 中训练神经网络
6.6 使用 Zygote.jl 的自动微分
6.7 使用梯度
6.8 动手实践：搭建和训练一个简单的神经网络