所有课程

循环神经网络与序列建模

章节 1: 序列数据简介

理解序列数据

序列数据的特点

序列模型的需求

将序列数字表示

常见的序列建模任务

第 1 章测验

章节 2: 循环神经网络基本原理

核心思想：迭代处理序列

简单RNN架构

隐藏状态的作用

RNN 单元的数学表述

循环神经网络中的信息流动

沿时间的反向传播 (BPTT)

展开网络进行训练

第 2 章测验

章节 3: 构建简单RNN

搭建开发环境

RNN 单元实现

使用框架API构建简单RNN层

处理输入与输出形状

构建一个简单RNN模型

RNN 的训练循环

动手实践：简单序列预测

第 3 章测验

章节 4: RNN训练中的难点

梯度消失问题

梯度爆炸问题

长期依赖学习的影响

梯度裁剪解析

权重初始化策略

激活函数考量

第 4 章测验

章节 5: 长短期记忆 (LSTM) 网络

通过门控应对循环神经网络的局限

LSTM单元结构

更新细胞状态

LSTM单元中的信息流动

第 5 章测验

章节 6: 门控循环单元 (GRUs)

介绍GRU：一种更简洁的门控架构

GRU 单元结构

计算候选隐藏状态

计算最终隐藏状态

GRU与LSTM的比较

计算效率考量

何时选择 GRU 或 LSTM

第 6 章测验

章节 7: 实现 LSTM 和 GRU

在深度学习框架中使用LSTM层

在深度学习框架中使用GRU层

配置 LSTM/GRU 层参数

堆叠循环层

理解双向循环神经网络

实现双向层

动手实践：情感分析

第 7 章测验

章节 8: 为循环神经网络准备序列数据

文本数据预处理概述

分词与词汇表构建

整数编码序列

嵌入层介绍

处理变长序列

填充值的掩码处理

序列数据批处理

时间序列数据预处理

实践：数据准备流程

第 8 章测验

章节 9: 序列建模应用方法

序列预测方法

时间序列预测模型

序列分类技术

文本分类模型

序列生成方法

文本生成模型

编码器-解码器架构简介

注意力机制概览

实战：时间序列预测

第 9 章测验

章节 10: 评估与调优序列模型

序列分类的评估指标

序列预测的评估指标

序列生成模型的评估指标

可视化模型行为

超参数调整策略

RNN的正则化方法

常见训练问题的排查

实践：调整RNN模型

第 10 章测验

RNN 单元实现

这部分内容有帮助吗？

参考文献

Finding Structure in Time, Jeffrey L. Elman, 1990 Cognitive Science, Vol. 14 (Wiley) DOI: 10.1207/s15516709cog1402_1 - 描述了简单循环网络（SRN），即本节中实现的简单RNN单元的基础架构。这篇论文引入了上下文层来维持随时间变化的状态。
Deep Learning, Ian Goodfellow, Yoshua Bengio, and Aaron Courville, 2016 (MIT Press) - 为循环神经网络提供了严谨的数学和概念基础，包括基本的RNN单元、其方程以及梯度消失/爆炸等挑战，详见第10章。
Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow, Aurélien Géron, 2022 (O'Reilly Media) - 第4版。提供了循环神经网络的实际实现和解释，包括简单RNN，通常从基本概念到特定框架代码逐步构建。它为读者从NumPy实现过渡到高级API提供了一个很好的桥梁。
Lecture Notes on Recurrent Neural Networks (Winter 2023, Lecture 4), Chris Chute, Jenny Hong, Kevin Du, 2023 (Stanford University) - 提供了RNN架构的详细讲义和解释，包括基本的RNN单元、其前向传播以及其背后的动机，通常附有说明性图表和理论见解。来自斯坦福大学CS224N 2023年冬季课程。

© 2025 ApX Machine Learning用心打造