匿名作者团队在ICLR 2025会议上提交的论文《TF-Score: Time-Series Forecasting Using Score-Based Diffusion Model》介绍
时间序列预测(Time-Series Forecasting)是机器学习与统计学中的核心问题,广泛应用于金融、气象、能源管理等领域。传统方法(如VAR、GARCH)和深度学习模型(如RNN、Transformer)虽取得进展,但难以捕捉复杂的时间依赖性和不确定性。近年来,扩散模型(Diffusion Model)因其在图像生成中的卓越表现受到关注,但其在时间序列预测中的应用仍缺乏理论支撑。
本研究提出TF-Score,一种基于分数随机微分方程(Score SDE)的扩散模型,旨在解决以下问题:
1. 理论空白:现有扩散模型在时间序列预测中多依赖经验调整,缺乏统一框架;
2. 性能瓶颈:传统扩散模型(如TimeGrad、CSDI)仅生成未来序列($x{pred}$)或完整序列($x{total}$),未充分挖掘历史与未来数据的关联性;
3. 采样效率:现有方法需额外训练或高计算成本(如Observation Self-Guidance)。
作者将现有扩散模型分为两类:
- 目标1:优化$∇{x{pred}} \log p(x{pred}|x{hist})$(如TimeGrad、CSDI);
- 目标2:优化$∇{x{total}} \log p(x{total}|x{hist})$(如Kollovieh等的工作)。
通过Theorem 1证明两者本质相同,但后者能更全面建模历史与未来的联合分布。基于此,TF-Score提出广义损失函数:
$$ \mathcal{L}(\theta) = \mathbb{E}{x{total}, x{total}^t} \left[ | \gamma \mathbf{m} \otimes \mathcal{L}{pred} + (1-\mathbf{m}) \otimes \mathcal{L}_{total} |_1 \right] $$
其中$\gamma$控制历史数据权重,$\mathbf{m}$为掩码矩阵,区分历史与未来部分。
TF-Score以DiffWave(Kong等,2021)为骨干网络,输入包括:
- 扩散时间步$t$(通过正弦嵌入编码);
- 历史数据$x{hist}$;
- 加噪后的完整序列$x{total}^t$。
采用VP-SDE(Variance Preserving SDE)和Euler-Maruyama采样器,默认设置下无需校正器(Corrector)。
数据集:涵盖6个基准数据集(Exchange、Solar、Electricity、Traffic、Taxi、Wiki),覆盖低维(8维)到高维(2000维)场景。
评估指标:CRPSsum(连续排名概率得分和),衡量预测分布与真实值的匹配度。
基线模型:包括经典方法(VAR、GARCH)、RNN(Vec-LSTM)、Transformer(Transformer-MAF)及扩散模型(TimeGrad、CSDI)。
(注:因论文处于双盲评审阶段,作者及机构信息暂隐。)