代码已开源！效果远超Transformer！AAAI 2021最佳论文Informer：最强最快的序列预测神器

5119

2021-03-09

在很多实际应用问题中，我们需要对长序列时间序列进行预测，例如用电使用规划。长序列时间序列预测（LSTF）要求模型具有很高的预测能力，即能够有效地捕捉输出和输入之间精确的长程相关性耦合。最近的研究表明，Transformer具有提高预测能力的潜力。

然而，Transformer存在一些严重的问题，如:

为了解决这些问题，我们设计了一个有效的基于变换器的LSTF模型Informer，它具有三个显著的特点：

在四个大规模数据集上的大量实验表明，Informer的性能明显优于现有的方法，为LSTF问题提供了一种新的解决方案。

从上表中,我们发现：

从上图中,我们发现：

Input Length：当预测短序列（如48）时，最初增加编码器/解码器的输入长度会降低性能，但进一步增加会导致MSE下降，因为它会带来重复的短期模式。然而，在预测中，输入时间越长，平均误差越低：信息者的参数敏感性。长序列（如168）。因为较长的编码器输入可能包含更多的依赖项；
Sampling Factor:我们验证了冗余点积的查询稀疏性假设；实践中，我们把sample factor设置为5即可，即c=5;
Number of Layer Stacking:Longer stack对输入更敏感，部分原因是接收到的长期信息较多

从上表中我们发现,

本文研究了长序列时间序列预测问题，提出了长序列预测的Informer方法。具体地：

在训练阶段，在基于Transformer的方法中，Informer获得了最佳的训练效率。
- 设计了ProbSparse self-attention和提取操作来处理vanilla Transformer中二次时间复杂度和二次内存使用的挑战。
- generative decoder缓解了传统编解码结构的局限性。
- 通过对真实数据的实验，验证了Informer对提高预测能力的有效性在测试阶段，我们的方法比其他生成式decoder方法要快得多。

登录用户可以查看和发表评论，请前往登录或注册。