这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:
本研究的作者包括Sebastian Pineda Arango、Pedro Mercado、Shubham Kapoor、Abdul Fatir Ansari、Lorenzo Stella、Huibin Shen、Hugo Senetaire、Caner Turkmen、Oleksandr Shchur、Danielle C. Maddix、Michael Bohlke-Schneider、Yuyang Wang和Syama Rangapuram。他们分别来自亚马逊网络服务(Amazon Web Services)、弗莱堡大学(University of Freiburg)和丹麦技术大学(Technical University of Denmark)。该研究发表于2025年的第28届国际人工智能与统计会议(AISTATS)上,会议地点为泰国迈考。
本研究的科学领域是时间序列预测,特别是针对包含外生变量(exogenous variables)的时间序列预测模型。外生变量提供了影响时间序列的外部因素信息,例如零售业中的促销活动或节假日对需求预测的影响。尽管近年来在预训练大规模语言模型架构用于时间序列预测方面取得了显著进展,但大多数模型并未充分利用外生变量,因为这些变量通常特定于某个任务或领域。因此,本研究提出了一种新方法,将外生变量整合到预训练的时间序列预测模型中,旨在提高预测的准确性。
本研究包括以下几个主要步骤:
模型设计:研究团队提出了一种名为ChronosX的模型,该模型通过模块化块将外生变量信息注入预训练的时间序列预测模型中,而不需要对预训练模型进行修改。ChronosX模型包含两个模块:一个模块用于更新过去的标记嵌入(token embeddings),另一个模块用于调整输出分布。
数据集构建:为了评估该方法的有效性,研究团队构建了一个包含32个不同合成数据集的基准测试集,这些数据集模拟了不同类型的外生变量和时间动态。每个数据集包含100个时间序列,每个时间序列的长度为1827天,预测长度为30天。
模型训练与评估:研究团队在合成数据集和真实数据集上对ChronosX模型进行了广泛的评估。在合成数据集上,ChronosX模型在简单和复杂数据集上的表现均优于现有基线模型。在真实数据集上,ChronosX模型在18个包含外生变量的数据集上表现出较低的预测误差。
模型扩展:研究团队还展示了ChronosX框架可以扩展到其他预训练模型,如TimeSFM和Moment,分别形成了TimeSFMX和MomentX模型。这些扩展模型同样表现出色,进一步验证了该方法的通用性。
合成数据集上的表现:在简单合成数据集上,ChronosX模型的加权分位数损失(Weighted Quantile Loss, WQL)比Chronos模型降低了22%。在复杂合成数据集上,ChronosX模型同样表现出色,验证了其在不同动态场景下的有效性。
真实数据集上的表现:在18个真实数据集上,ChronosX模型在WQL和平均绝对缩放误差(Mean Absolute Scaled Error, MASE)上均表现优异,特别是在WQL上表现最佳,证明了其在实际应用中的潜力。
模型扩展结果:TimeSFMX和MomentX模型在合成和真实数据集上的表现也显著优于其原始预训练模型,进一步验证了ChronosX框架的通用性和有效性。
本研究提出了一种名为ChronosX的新方法,成功地将外生变量整合到预训练的时间序列预测模型中。通过模块化设计,ChronosX模型能够在不同任务和领域中有效利用外生变量,显著提高了预测的准确性。此外,ChronosX框架还可以扩展到其他预训练模型,展示了其广泛的应用潜力。研究团队还构建了一个包含32个合成数据集的基准测试集,为未来研究提供了宝贵的资源。
研究团队还进行了详细的消融实验,分析了外生变量对模型性能的影响,并验证了ChronosX模型在不同模型规模下的表现。这些实验进一步增强了研究结果的可靠性和说服力。
本研究在时间序列预测领域提出了一个具有创新性和广泛适用性的方法,为未来的研究和实际应用提供了重要的参考。