趋近智
既然我们已明确了序列数据的特性以及标准前馈网络的局限,现在来看看序列模型旨在解决的各类问题。了解这些常见任务能为我们后续学习的架构和技术提供背景。序列建模问题通常分为几大类,主要区别在于它们的输入和输出结构。
最直接的用途也许是预测序列中的后续内容。给定一系列观测值 ,目标是预测 的值,或者预测一系列未来值 。
"这类包含许多应用:"
主要理念是学习序列内部的时间关联,从而对未来做出明智的预测。根据您是预测单个下一步还是多个步骤,这可视为“多对一”(从多个输入预测一个输出)或“多对多”(从多个输入预测多个输出)的问题结构。
依据前序序列 () 预测下一个元素 () 的流程。每个步骤处理一个输入并更新表示序列历史的内部状态。
在序列分类中,目标是为整个输入序列分配一个单一的类别标签。我们不是预测下一个元素,而是希望理解整个序列所代表的整体含义或属性。
常见例子有:
通常,模型处理整个序列 ,然后生成一个单一的输出分类 。这符合“多对一”的结构,即多个输入映射到一个单一的类别输出。
对整个序列 ( 到 ) 进行分类的流程。信息按顺序处理,最终的分类判断基于整个序列汇总的信息做出。
序列生成涉及依据学习到的特定模式创建新的序列。与预测不同,预测的目标通常是下一步,而生成则常旨在生成更长、连贯的序列。
应用包括:
生成模型学习训练数据中序列的概率分布。它们可以从该分布中抽样以创建新序列。这有时可以从一个“种子”输入(例如一个句子的开头或一个音乐乐句)开始,然后继续一个接一个地生成元素。此任务可涉及“一对多”(从单一起点或上下文生成序列)或“多对多”结构(生成迭代进行,可能基于先前的输入或输出)。
生成序列 () 的流程。从一个初始信号开始,模型生成第一个元素 ()。这个输出可以作为输入(虚线)反馈,以生成下一个元素 (),依此类推。
一个更复杂的类别涉及将输入序列转换为不同的输出序列。这些任务的关键在于,输入和输出序列通常具有不同的长度和结构。
例子有:
这些任务通常需要更精密的架构,常包含两个主要组成部分:一个“编码器”,将输入序列处理成固定大小的表示;一个“解码器”,从该表示生成输出序列。我们将在本课程后面提及这些架构。
了解这些不同的序列建模任务是重要的第一步。您旨在解决的具体任务将显著影响您的模型设计、数据准备方式以及性能评估方法。在后续章节中,我们将开始查看循环神经网络 (neural network) (RNN),这是一类模型,专门用于处理这些任务中数据的序列特性。
这部分内容有帮助吗?
© 2026 ApX Machine LearningAI伦理与透明度•