该文档属于类型a,即报告了一项原创研究。以下是针对该研究的学术报告:
该研究由Arvind Pillai、Dimitris Spathis、Subigya Nepal、Amanda C. Collins、Daniel M. Mackin、Michael V. Heinz、Tess Z. Griffin、Nicholas C. Jacobson和Andrew Campbell共同完成。研究机构包括Dartmouth College(美国)、University of Cambridge(英国)、Stanford University(美国)以及Google Research(英国)。该研究发表于2025年的“Conference on Health, Inference, and Learning (CHIL)”会议,并收录在《Proceedings of Machine Learning Research》期刊中。
该研究的主要科学领域是健康感知与机器学习,特别是时间序列数据与大型语言模型(LLM, Large Language Model)的结合。传统方法通常将传感器数据转换为文本提示(prompting),但这一过程容易出错、计算成本高且需要领域专业知识,尤其是在处理长时间序列数据时。尽管时间序列基础模型(TFM, Time Series Foundation Model)近年来在从时间数据中学习表示方面表现出强大的能力,但将TFM与LLM结合仍然具有挑战性。因此,本研究提出了Time2Lang框架,旨在直接映射TFM输出到LLM表示,从而避免中间文本转换的复杂过程。
研究的背景知识包括:LLM在健康应用中的潜力、TFM在时间序列数据处理中的优势,以及现有方法在长时间序列数据处理中的局限性。研究的目标是通过Time2Lang框架,实现TFM与LLM的有效集成,同时最小化信息损失,并提高健康感知任务的性能。
研究流程主要包括以下几个步骤:
框架设计:Time2Lang框架的核心是学习从TFM到LLM的映射。具体来说,框架包括一个冻结的TFM(Chronos)、一个可学习的输入编码器(f)、一个冻结的LLM(Llama)以及一个可学习的投影层(g)。通过这种方式,Time2Lang可以直接将TFM的输出嵌入到LLM中,而无需进行文本转换。
数据生成与预处理:研究使用高斯过程(Gaussian Process)生成合成数据,以模拟复杂的时间序列模式。这些数据用于训练Time2Lang框架,并以周期性预测作为预训练任务。合成数据生成长度为1440的时间序列(即一天的数据,每分钟一个数据点),并包含周期性特征。
模型训练:Time2Lang在合成数据上进行自监督学习(SSL, Self-Supervised Learning),目标是预测时间序列的周期性。训练过程中,首先通过TFM提取时间序列特征,然后通过输入编码器将这些特征压缩并映射到LLM的输入嵌入层。最后,通过投影层将LLM的输出映射到周期性分类任务中。
数据集与评估:研究在两个真实世界的数据集上评估Time2Lang的性能。第一个数据集是用于日常抑郁症预测的步数数据,包含256名参与者的17,251天数据;第二个数据集是基于对话时长的学生心理健康分类数据,包含46名参与者10周的数据。评估任务包括抑郁症分类和心理健康状态分类。
实验与分析:研究通过多个实验验证Time2Lang的性能,包括与传统提示方法的对比、推理时间分析、预训练数据规模的影响、周期性类别的数量对性能的影响,以及嵌入与时间序列特征(如自相关因子)的相关性分析。
性能表现:Time2Lang在抑郁症预测任务中达到了0.57的AUROC(Area Under the Receiver Operating Characteristic Curve)和0.73的AUPRC(Area Under the Precision-Recall Curve),优于传统的提示方法。在心理健康状态分类任务中,Time2Lang的AUROC为0.71,AUPRC为0.74,同样表现出色。
效率分析:Time2Lang的推理时间在不同输入长度下保持稳定,而传统提示方法的推理时间随着输入长度的增加而显著增加。这表明Time2Lang在处理长时间序列数据时具有更高的效率。
嵌入与时间序列特征的相关性:研究发现,Time2Lang生成的嵌入能够有效捕捉时间序列的关键特征,如自相关因子(ACF, Auto-Correlation Factor)。嵌入与ACF之间的相关性分析表明,Time2Lang能够保留时间序列的长期依赖关系。
预训练数据与周期性类别的影响:研究还发现,预训练数据的规模和周期性类别的数量对下游任务的性能有显著影响。使用200k样本和6个周期性类别的预训练数据能够达到最佳性能。
Time2Lang框架成功地将TFM与LLM集成,实现了在健康感知任务中的高效表现。研究结果表明,Time2Lang不仅能够有效处理长时间序列数据,还能保留时间序列的关键特征。此外,Time2Lang的推理时间在不同输入长度下保持稳定,显示出其在处理大规模数据时的优势。该研究为未来结合通用大型模型进行复杂健康任务的研究奠定了基础。
研究还探讨了Time2Lang在多模态数据中的应用潜力,并提出了未来研究方向,包括扩展到生理信号处理(如心电信号和光电容积描记信号)以及改进缺失数据处理方法。这些方向将进一步增强Time2Lang在健康监测和干预系统中的适用性。