所有课程

循环神经网络与序列建模

章节 1: 序列数据简介

理解序列数据

序列数据的特点

序列模型的需求

将序列数字表示

常见的序列建模任务

第 1 章测验

章节 2: 循环神经网络基本原理

核心思想：迭代处理序列

简单RNN架构

隐藏状态的作用

RNN 单元的数学表述

循环神经网络中的信息流动

沿时间的反向传播 (BPTT)

展开网络进行训练

第 2 章测验

章节 3: 构建简单RNN

搭建开发环境

RNN 单元实现

使用框架API构建简单RNN层

处理输入与输出形状

构建一个简单RNN模型

RNN 的训练循环

动手实践：简单序列预测

第 3 章测验

章节 4: RNN训练中的难点

梯度消失问题

梯度爆炸问题

长期依赖学习的影响

梯度裁剪解析

权重初始化策略

激活函数考量

第 4 章测验

章节 5: 长短期记忆 (LSTM) 网络

通过门控应对循环神经网络的局限

LSTM单元结构

更新细胞状态

LSTM单元中的信息流动

第 5 章测验

章节 6: 门控循环单元 (GRUs)

介绍GRU：一种更简洁的门控架构

GRU 单元结构

计算候选隐藏状态

计算最终隐藏状态

GRU与LSTM的比较

计算效率考量

何时选择 GRU 或 LSTM

第 6 章测验

章节 7: 实现 LSTM 和 GRU

在深度学习框架中使用LSTM层

在深度学习框架中使用GRU层

配置 LSTM/GRU 层参数

堆叠循环层

理解双向循环神经网络

实现双向层

动手实践：情感分析

第 7 章测验

章节 8: 为循环神经网络准备序列数据

文本数据预处理概述

分词与词汇表构建

整数编码序列

嵌入层介绍

处理变长序列

填充值的掩码处理

序列数据批处理

时间序列数据预处理

实践：数据准备流程

第 8 章测验

章节 9: 序列建模应用方法

序列预测方法

时间序列预测模型

序列分类技术

文本分类模型

序列生成方法

文本生成模型

编码器-解码器架构简介

注意力机制概览

实战：时间序列预测

第 9 章测验

章节 10: 评估与调优序列模型

序列分类的评估指标

序列预测的评估指标

序列生成模型的评估指标

可视化模型行为

超参数调整策略

RNN的正则化方法

常见训练问题的排查

实践：调整RNN模型

第 10 章测验

序列模型的需求

这部分内容有帮助吗？

参考文献

Deep Learning, Ian Goodfellow, Yoshua Bengio, Aaron Courville, 2016 (MIT Press) - 一本关于深度学习的教科书，其中专门的章节透彻解释了对序列模型的需求以及循环神经网络的原理。
Finding structure in time, Jeffrey L. Elman, 1990 Cognitive Science, Vol. 14 (Wiley) DOI: 10.1207/S15516709COG1402_1 - 一篇基础论文，介绍了循环神经网络（通常称为Elman网络），通过内部状态机制展示了它们学习和表示序列数据中时间依赖性的能力。
CS224n: Natural Language Processing with Deep Learning, Diyi Yang, Tatsunori Hashimoto, 2025 (Stanford University) - 一所大学的在线课程资料，提供讲座和阅读材料，清晰解释了前馈网络在自然语言处理中的局限性，并介绍了RNN等序列模型背后的架构和动机。
Learning long-term dependencies with gradient descent is difficult, Yoshua Bengio, Patrice Simard, Paul Rosen, 1993 Advances in Neural Information Processing Systems, Vol. 6 DOI: 10.5591/978-1-57766-004-8.735 - 本文指出了循环神经网络中梯度消失和梯度爆炸问题，强调了学习长期依赖性时遇到的困难，并影响了更健壮序列模型的开发。

© 2025 ApX Machine Learning用心打造