所有课程

循环神经网络与序列建模

章节 1: 序列数据简介

理解序列数据

序列数据的特点

序列模型的需求

将序列数字表示

常见的序列建模任务

第 1 章测验

章节 2: 循环神经网络基本原理

核心思想：迭代处理序列

简单RNN架构

隐藏状态的作用

RNN 单元的数学表述

循环神经网络中的信息流动

沿时间的反向传播 (BPTT)

展开网络进行训练

第 2 章测验

章节 3: 构建简单RNN

搭建开发环境

RNN 单元实现

使用框架API构建简单RNN层

处理输入与输出形状

构建一个简单RNN模型

RNN 的训练循环

动手实践：简单序列预测

第 3 章测验

章节 4: RNN训练中的难点

梯度消失问题

梯度爆炸问题

长期依赖学习的影响

梯度裁剪解析

权重初始化策略

激活函数考量

第 4 章测验

章节 5: 长短期记忆 (LSTM) 网络

通过门控应对循环神经网络的局限

LSTM单元结构

更新细胞状态

LSTM单元中的信息流动

第 5 章测验

章节 6: 门控循环单元 (GRUs)

介绍GRU：一种更简洁的门控架构

GRU 单元结构

计算候选隐藏状态

计算最终隐藏状态

GRU与LSTM的比较

计算效率考量

何时选择 GRU 或 LSTM

第 6 章测验

章节 7: 实现 LSTM 和 GRU

在深度学习框架中使用LSTM层

在深度学习框架中使用GRU层

配置 LSTM/GRU 层参数

堆叠循环层

理解双向循环神经网络

实现双向层

动手实践：情感分析

第 7 章测验

章节 8: 为循环神经网络准备序列数据

文本数据预处理概述

分词与词汇表构建

整数编码序列

嵌入层介绍

处理变长序列

填充值的掩码处理

序列数据批处理

时间序列数据预处理

实践：数据准备流程

第 8 章测验

章节 9: 序列建模应用方法

序列预测方法

时间序列预测模型

序列分类技术

文本分类模型

序列生成方法

文本生成模型

编码器-解码器架构简介

注意力机制概览

实战：时间序列预测

第 9 章测验

章节 10: 评估与调优序列模型

序列分类的评估指标

序列预测的评估指标

序列生成模型的评估指标

可视化模型行为

超参数调整策略

RNN的正则化方法

常见训练问题的排查

实践：调整RNN模型

第 10 章测验

长期依赖学习的影响

这部分内容有帮助吗？

参考文献

Long Short-Term Memory, Sepp Hochreiter, Jürgen Schmidhuber, 1997 Neural Computation, Vol. 9 (MIT Press) DOI: 10.1162/neco.1997.9.8.1735 - 提出了长短期记忆（LSTM）架构，这是旨在克服梯度消失问题并有效学习循环神经网络中长期依赖的重大进展。
Deep Learning, Ian Goodfellow, Yoshua Bengio, Aaron Courville, 2016 (MIT Press) - 第10章详细介绍了循环神经网络的理论和实践，包括对梯度消失和梯度爆炸以及各种解决方案的全面解释。
Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation, Kyunghyun Cho, Bart van Merriënboer, Caglar Gulcehre, Dzmitry Bahdanau, Fethi Bougares, Holger Schwenk, Yoshua Bengio, 2014 Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP) (Association for Computational Linguistics) DOI: 10.3115/v1/D14-1179 - 这篇论文提出了门控循环单元（GRU）作为LSTM在序列建模中的高效替代方案，尤其解决了梯度消失等问题。

© 2025 ApX Machine Learning用心打造