所有课程

循环神经网络与序列建模

章节 1: 序列数据简介

理解序列数据

序列数据的特点

序列模型的需求

将序列数字表示

常见的序列建模任务

第 1 章测验

章节 2: 循环神经网络基本原理

核心思想：迭代处理序列

简单RNN架构

隐藏状态的作用

RNN 单元的数学表述

循环神经网络中的信息流动

沿时间的反向传播 (BPTT)

展开网络进行训练

第 2 章测验

章节 3: 构建简单RNN

搭建开发环境

RNN 单元实现

使用框架API构建简单RNN层

处理输入与输出形状

构建一个简单RNN模型

RNN 的训练循环

动手实践：简单序列预测

第 3 章测验

章节 4: RNN训练中的难点

梯度消失问题

梯度爆炸问题

长期依赖学习的影响

梯度裁剪解析

权重初始化策略

激活函数考量

第 4 章测验

章节 5: 长短期记忆 (LSTM) 网络

通过门控应对循环神经网络的局限

LSTM单元结构

更新细胞状态

LSTM单元中的信息流动

第 5 章测验

章节 6: 门控循环单元 (GRUs)

介绍GRU：一种更简洁的门控架构

GRU 单元结构

计算候选隐藏状态

计算最终隐藏状态

GRU与LSTM的比较

计算效率考量

何时选择 GRU 或 LSTM

第 6 章测验

章节 7: 实现 LSTM 和 GRU

在深度学习框架中使用LSTM层

在深度学习框架中使用GRU层

配置 LSTM/GRU 层参数

堆叠循环层

理解双向循环神经网络

实现双向层

动手实践：情感分析

第 7 章测验

章节 8: 为循环神经网络准备序列数据

文本数据预处理概述

分词与词汇表构建

整数编码序列

嵌入层介绍

处理变长序列

填充值的掩码处理

序列数据批处理

时间序列数据预处理

实践：数据准备流程

第 8 章测验

章节 9: 序列建模应用方法

序列预测方法

时间序列预测模型

序列分类技术

文本分类模型

序列生成方法

文本生成模型

编码器-解码器架构简介

注意力机制概览

实战：时间序列预测

第 9 章测验

章节 10: 评估与调优序列模型

序列分类的评估指标

序列预测的评估指标

序列生成模型的评估指标

可视化模型行为

超参数调整策略

RNN的正则化方法

常见训练问题的排查

实践：调整RNN模型

第 10 章测验

文本数据预处理概述

这部分内容有帮助吗？

参考文献

Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, Daniel Jurafsky and James H. Martin, 2025 - 一本综合性教科书，涵盖自然语言处理的基础概念，包括分词、文本规范化以及多种词表示形式。
Deep Learning, Ian Goodfellow, Yoshua Bengio, and Aaron Courville, 2016 (MIT Press) - 一本关于深度学习的基础教科书，为神经网络、循环神经网络等序列模型以及这些模型所需数值数据表示的普遍必要性提供了背景。
Natural Language Processing with Transformers: Building Innovative Applications with NLP, Lewis Tunstall, Leandro von Werra, and Thomas Wolf, 2022 (O'Reilly Media) - 一本关于使用深度学习进行现代自然语言处理的实用指南，详细介绍了当前的文本预处理技术、分词策略（包括子词）以及为序列模型创建模型输入张量。

© 2025 ApX Machine Learning用心打造