趋近智
在应用任何建模技术之前,理解时间序列数据中的结构是重要一步。时间序列数据中的观测值是时间相关的,这种相关性通常源于潜在模式。时间序列 通常由几个未观测到的部分构成,这些部分影响其随时间的变化。识别这些部分有助于选择合适的分析方法并构建更好的预测模型。
下面我们分析通常讨论的四个主要组成部分:
趋势代表数据中的长期方向或变动。它反映了在较长时间内潜在的增长或下降,同时忽略短期波动。
明显的趋势通常意味着序列的均值随时间变化。正如我们将在第2章中看到的,这是许多原始时间序列非平稳的主要原因,而许多标准模型都要求我们处理这种状况。
一个显示总体上升趋势的简单序列。
季节性指代在固定且已知周期内重复出现的模式。这个周期可以是每年、每季度、每月、每周甚至每天,具体取决于数据的性质。
季节性与趋势不同,因为它代表了围绕趋势的短期、规律波动。在第5章讨论SARIMA模型时,处理季节性是一个重点。
显示每年重复模式,并在第四季度达到高峰的销售数据。
周期性组成部分代表中长期波动,这些波动没有固定或已知周期。这些周期通常跨越数年,并通常与更广范围的经济或商业状况相关。
季节性模式和周期性模式之间的主要区别在于周期长度及其可预测性。季节性具有固定、已知周期(例如,12个月),而周期性模式具有可变、未知周期(例如,数年)。由于其不规则性,明确地对周期性组成部分建模可能很困难。
不规则性组成部分,也称为残差或噪声,代表时间序列中随机、不可预测的波动,这些波动无法通过趋势、季节性或周期性组成部分来解释。
这些组成部分通常被假定以特定方式组合,以形成观测到的时间序列 。这种组合的两种最常见的模型是:
加法模型: 假定组成部分相加。当季节性/周期性波动的幅度随时间相对恒定时适用,无论趋势水平如何。
乘法模型: 假定组成部分相乘。当季节性/周期性波动的幅度随着趋势水平的上升或下降而增加或减少时,这种模型通常更合适。 有时,乘法模型可以通过对序列取对数转换为加法模型:。
将时间序列分解为这些组成部分的过程称为分解,我们将在第2章中使用Python实现它。理解这些基本组成部分很重要,因为趋势和季节性的存在显著影响合适预测模型的选择(如ARIMA与SARIMA)以及所需的预处理步骤(如差分以实现平稳性)。本章后面讨论的数据可视化,通常是识别可能存在哪些组成部分的第一步。
一个时间序列,显示上升趋势,结合重复的季节性模式(周期为4个时间步长)和一些随机噪声。
这部分内容有帮助吗?
© 2026 ApX Machine LearningAI伦理与透明度•