所有课程

循环神经网络与序列建模

章节 1: 序列数据简介

理解序列数据

序列数据的特点

序列模型的需求

将序列数字表示

常见的序列建模任务

第 1 章测验

章节 2: 循环神经网络基本原理

核心思想：迭代处理序列

简单RNN架构

隐藏状态的作用

RNN 单元的数学表述

循环神经网络中的信息流动

沿时间的反向传播 (BPTT)

展开网络进行训练

第 2 章测验

章节 3: 构建简单RNN

搭建开发环境

RNN 单元实现

使用框架API构建简单RNN层

处理输入与输出形状

构建一个简单RNN模型

RNN 的训练循环

动手实践：简单序列预测

第 3 章测验

章节 4: RNN训练中的难点

梯度消失问题

梯度爆炸问题

长期依赖学习的影响

梯度裁剪解析

权重初始化策略

激活函数考量

第 4 章测验

章节 5: 长短期记忆 (LSTM) 网络

通过门控应对循环神经网络的局限

LSTM单元结构

更新细胞状态

LSTM单元中的信息流动

第 5 章测验

章节 6: 门控循环单元 (GRUs)

介绍GRU：一种更简洁的门控架构

GRU 单元结构

计算候选隐藏状态

计算最终隐藏状态

GRU与LSTM的比较

计算效率考量

何时选择 GRU 或 LSTM

第 6 章测验

章节 7: 实现 LSTM 和 GRU

在深度学习框架中使用LSTM层

在深度学习框架中使用GRU层

配置 LSTM/GRU 层参数

堆叠循环层

理解双向循环神经网络

实现双向层

动手实践：情感分析

第 7 章测验

章节 8: 为循环神经网络准备序列数据

文本数据预处理概述

分词与词汇表构建

整数编码序列

嵌入层介绍

处理变长序列

填充值的掩码处理

序列数据批处理

时间序列数据预处理

实践：数据准备流程

第 8 章测验

章节 9: 序列建模应用方法

序列预测方法

时间序列预测模型

序列分类技术

文本分类模型

序列生成方法

文本生成模型

编码器-解码器架构简介

注意力机制概览

实战：时间序列预测

第 9 章测验

章节 10: 评估与调优序列模型

序列分类的评估指标

序列预测的评估指标

序列生成模型的评估指标

可视化模型行为

超参数调整策略

RNN的正则化方法

常见训练问题的排查

实践：调整RNN模型

第 10 章测验

计算效率考量

这部分内容有帮助吗？

参考文献

Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation, Kyunghyun Cho, Bart van Merrienboer, Caglar Gulcehre, Dzmitry Bahdanau, Fethi Bougares, Holger Schwenk, Yoshua Bengio, 2014 Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP) DOI: 10.48550/arXiv.1406.1078 - 介绍门控循环单元 (GRU) 作为 LSTM 的简化替代方案，重点介绍其架构和在序列建模中的早期应用。
Long Short-Term Memory, Sepp Hochreiter and Jürgen Schmidhuber, 1997 Neural Computation, Vol. 9 (MIT Press) DOI: 10.1162/neco.1997.9.8.1735 - 首次提出长短期记忆 (LSTM) 架构的论文，GRU 是对其的简化。
Deep Learning, Ian Goodfellow, Yoshua Bengio, and Aaron Courville, 2016 (MIT Press) - 一本标准教材，详细阐述了循环神经网络的理论和应用，包括 LSTM 和 GRU 的比较及其计算特性。

© 2025 ApX Machine Learning用心打造