趋近智
循环神经网络、LSTM 和 GRU 模型需要数值张量格式的输入数据,通常具有像 这样的特定形状。然而,实际中的序列数据,例如原始文本或时间序列测量值,很少以这种即用型格式存在。本章侧重于弥补这一差距的必要步骤。
您将学到将序列数据转换为适用于循环模型的结构的常用方法。对于文本数据,这包括以下步骤:
对于时间序列数据,我们将介绍标准化和创建观测值滑动窗口等方法。最后,我们将讨论如何将准备好的数据组织成批次,以便进行高效的模型训练。学完本章,您将能够构建数据管道,对常见序列数据集进行预处理,以便输入到循环神经网络中。
8.1 文本数据预处理概述
8.2 分词与词汇表构建
8.3 整数编码序列
8.4 嵌入层介绍
8.5 处理变长序列
8.6 序列填充
8.7 填充值的掩码处理
8.8 序列数据批处理
8.9 时间序列数据预处理
8.10 实践:数据准备流程
© 2026 ApX Machine Learning用心打造