这篇论文名为“Adaptive Normalization for Non-stationary Time Series Forecasting: A Temporal Slice Perspective”,由Zhiding Liu等人撰写。它主要探讨了使用深度学习模型进行时间序列预测的挑战,特别是在处理非平稳时间序列数据时。作者提出了一种名为Slicing Adaptive Normalization (SAN)的新方法,用于改进时间序列预测的准确性。SAN通过在局部时间片(或称子序列)上消除时间序列的非平稳性,而不是整体实例上,从而提高了时间序列预测的灵活性和准确性。
论文的贡献包括:
- 提出SAN框架,它通过从时间片角度建模非平稳性,更好地移除输入序列中的非平稳因素,同时保留其独特模式。
- 设计了灵活的统计预测模块,独立建模统计属性的演变趋势。这通过分治法简化了非平稳预测任务。
- 在九个真实世界数据集上进行了充分的实验。结果表明,SAN能够应用于各种主流预测模型,并显著提高性能。
此外,作者还进行了与现有归一化方法的比较,发现SAN在大多数情况下优于其他方法。他们通过实验表明,SAN特别适用于处理非平稳数据集,如交易和流感样本数据集。
作者还进行了定性评估,展示了使用SAN的FEDformer模型在ETTm2数据集上的样本预测结果,与其他方法相比,SAN产生的预测结果更为现实。
总体来说,这项研究提出了一种新的时间序列预测方法,通过从时间片的角度来处理和理解非平稳性,显著提高了预测模型的性能。
LAMDA
- TSF-Linear:一种特殊类型的线性模型,用于长期序列预测。
- DLinear:该模型专注于从数据中分离和建模趋势(Trend)和剩余(Remaining)部分。这种方法允许模型分别处理时间序列数据的长期趋势和短期波动。
通过线性变换 Ynew=WYold 将历史数据映射到未来预测。这种方法假设未来的值可以通过历史数据的线性组合来预测。
时间步依赖性(Time-step-dependent)
这个属性指的是模型的预测能力依赖于时间步的顺序。线性模型虽然简单,但在建模时间模式方面非常有效。
数据依赖性(Data-dependent)
模型如何根据数据本身的特点来做出预测,而不仅仅是时间步的顺序。
当输入历史序列的长度不小于周期时,线性映射可以预测周期信号。但这并不是唯一的解决方案
the linear model fits seasonality well but performs poorly on the trend
趋势可能涉及到随时间变化的系数或者结构性断裂,这是单纯的线性模型无法捕捉的
Reversible Instance Normalization(RevIN)是一种用于时间序列预测的技术,旨在提高模型对分布偏移的鲁棒性。在实际应用中,模型通常在一个数据分布上进行训练,但在另一个可能有所不同的数据分布上进行测试和使用。这种变化被称为分布偏移,可能会显著影响模型性能。
RevIN的核心思想是调整模型的输入和输出,以适应可能出现的分布偏移。这是通过将实例归一化(Instance Normalization)应用于模型的每个输入实例来实现的。实例归一化涉及到从输入数据中减去平均值并除以标准差,使得每个输入特征的分布都具有零均值和单位方差。这个过程可以帮助模型更好地处理输入数据中的变化,从而使预测更加准确。
然而,简单的归一化可能会导致信息丢失,因为它会移除数据中的绝对尺度信息。RevIN通过在模型的后期阶段将归一化过程逆转来解决这个问题。在输出端,RevIN重新引入了原始数据的尺度和位置信息,从而恢复了被归一化过程改变的特征。通过这种方式,RevIN不仅提高了模型对新数据分布的适应性,还保持了数据中的重要信息。
直接对输入数据应用归一化可能会消除统计信息,导致预测不准确。而使用RevIN,尤其是在趋势数据上,可以将连续变化的趋势转化为多个具有固定和类似趋势的片段,这些片段展现出周期性特征。
对于季节性信号,RevIN调整了范围但并没有改变周期性。
对于趋势信号,RevIN将每个片段缩放到相同的范围,并展示出周期性模式。这使得模型能够更好地学习或记忆趋势项。
RevIN对原始连续变化趋势数据的影响,将其转化为多个段,每个段都具有固定和相似的趋势,显示出周期性特征。这种方法有助于减轻由于过去时间步累积误差导致的趋势预测错误,从而提高了预测结果的准确性。
Slice-level Adaptive Normalization (SAN) 技术,这是一种针对非平稳时间序列预测设计的方法。
非平稳时间序列指的是其统计特性如均值和方差随时间变化的序列。SAN的目标是通过对时间序列的每个小片段进行标准化处理来改善预测模型的性能。
- 标准化:每个片段都被独立地标准化
- 预测模型
- 统计预测模块:得到统计特性
- 反标准化:考虑了预测模型输出的统计特性,并将这些特性重新引入到最终预测中,这有助于在保持数据特征的同时提高预测准确性
多变量时间序列预测中的两种不同策略:Channel Dependent (CD) 策略和 Channel Independent (CI) 策略