本研究由华东师范大学Peng Chen、阿里巴巴集团Yingying Zhang、奥尔堡大学Yunyao Cheng等学者合作完成,通讯作者为华东师范大学Yang Shu。论文《Pathformer: Multi-Scale Transformers with Adaptive Pathways for Time Series Forecasting》发表于ICLR 2024(国际学习表征会议),代码已开源在GitHub平台。
科学领域:该研究属于时间序列预测领域,涉及深度学习与Transformer架构的优化。传统Transformer模型在时间序列预测中存在两大局限:
1. 多尺度建模不完整:现有方法通常仅从固定时间分辨率(temporal resolution)或固定时间距离(temporal distance)单一视角建模,难以捕捉真实场景中跨尺度的动态特征(如云计算资源需求的日/月/季节性波动)。
2. 静态建模过程:不同时间序列的时序动态差异显著(如高频波动与缓慢趋势),但现有模型无法自适应调整多尺度建模策略。
研究目标:提出Pathformer模型,通过整合多尺度时间分辨率与时间距离的双重视角,并引入自适应路径(adaptive pathways)机制,实现动态的多尺度特征提取与融合,提升预测精度与泛化能力。
Pathformer由三个核心模块组成:
- 实例归一化(Instance Norm):解决训练与测试数据的分布偏移问题。
- 自适应多尺度块(AMS Block):核心创新模块,包含多尺度Transformer块(MST Block)和自适应路径机制。
- 预测器(Predictor):全连接网络,适配长序列预测任务。
数据集:在11个真实世界数据集上验证,涵盖电力(ETT)、气象(Weather)、交通(Traffic)、云计算资源(Cloud Cluster)等领域。
基线模型:对比PatchTST、NLinear、ScaleFormer等7种前沿模型。
评估指标:均方误差(MSE)与平均绝对误差(MAE)。
预测性能:
迁移学习能力:
消融实验:
科学价值:
- 首次提出“时间分辨率+时间距离”双视角统一的多尺度建模框架,解决了传统方法单一视角的局限性。
- 通过自适应路径机制,实现了对异构时间序列的动态特征提取,为Transformer在时序领域的适配提供了新范式。
应用价值:
- 在云计算资源预测等实际场景中,Pathformer可精准捕捉多尺度需求波动,支持弹性资源调度。
- 开源模型与代码推动了时间序列预测领域的可复现研究。
论文附详实的附录,包括:
- 单变量预测实验结果(Pathformer在56组实验中50项最优)。
- 输入长度敏感性分析(输入序列长度从48增至192时,预测误差持续下降)。
- 完整的数据集统计与基线模型代码链接,保障研究透明度。