自监督学习加速度计数据揭示睡眠与死亡率关联的新见解

自监督学习手腕加速度计数据揭示睡眠与死亡率关联的新见解

在现代社会中,睡眠作为生命必需的基础活动,其重要性不言而喻。通过准确测量和分类睡眠/清醒状态以及不同的睡眠阶段,在临床研究中对睡眠障碍的诊断以及解读消费者设备所提供的运动和心理健康数据都是至关重要的。然而现有的非多导睡眠图(Polysomnography, PSG)睡眠分类技术主要依赖于启发式方法,这些方法常常是在相对较小的样本人群中开发的,存在一定的局限性。因此,本研究的目标是通过腕戴加速度计确定睡眠阶段分类的准确性,并探讨睡眠时长和效率与死亡率之间的关联。 研究流程及机器学习模型设计

研究背景

由Hang Yuan及其团队(包括Tatiana Plekhanova, Rosemary Walmsley, Amy C. Reynolds, Kathleen J. Maddison等)撰写,这篇论文发表在2024年的npj Digital Medicine期刊上。研究背后的驱动力是克服现有方法在大规模应用中的局限性,并通过自监督深度学习方法改进睡眠阶段分类技术。

睡眠在生命活动中占据了三分之一的时间,然而在自由生活环境中的睡眠评估却存在很大的困难。传统的主观睡眠日记(Self-report sleep diaries)虽然能捕捉到个体的主观感受,但与设备测量的客观睡眠参数之间的相关性较低。而被公认为睡眠测量金标准的实验室多导睡眠图,虽然能提供准确的睡眠数据,但因其高成本和复杂性,并不适用于大规模研究。相比之下,手腕佩戴的加速度计因其便携性和用户负担低的特点,更适用于大规模流行病研究。

然而,目前消费级和研究级腕戴设备中的睡眠评估算法多为专有技术,在小规模人群中进行验证,其测量的有效性仍然不明确。睡眠分类方法(如区分清醒、NREM和REM睡眠阶段)主要依赖于手工特征,这些特征可能无法充分利用信号中的所有信息。因此,数据驱动的方法如深度学习可能具有一定优势。

论文来源

这篇论文由多名来自不同研究机构的研究者共同撰写,包括来自University of Oxford、Seoul National University Bundang Hospital等。研究发表于2024年的npj Digital Medicine期刊上,引用编号为https://doi.org/10.1038/s41746-024-01065-0。

研究方法和流程

研究对象与数据收集

研究首先利用多任务自监督学习,从在UK Biobank中的70万天三轴加速度计数据中提取特征。然后,作者将特征提取器与深度循环网络(Recurrent Neural Network, RNN)进行微调,使用PSG作为标准训练一个睡眠阶段分类器。经过排除,研究采用了1448个参与者晚上的数据进行模型训练。对于内部验证,包括了1395名参与者,而外部验证则包括了53名参与者。

多导睡眠图对比

在内部验证中,与PSG相比,模型的总睡眠时间偏差为8.9分钟(95% 置信区间:-89.0到106.9分钟),REM睡眠时间偏差为-18.7分钟(95% 置信区间:-130.9到93.6分钟),而NREM睡眠时间偏差为27.6分钟(95% 置信区间:-100.6到155.8分钟)。

在外部验证中,总睡眠时间偏差为34.7分钟(95% 置信区间:-37.8到107.2分钟),REM睡眠时间偏差为-2.6分钟(95% 置信区间:-68.4到73.4分钟),而NREM睡眠时间偏差为32.1分钟(95% 置信区间:-54.4到118.5分钟)。整体上,模型倾向于低估REM和短期睡眠,而高估NREM和长期睡眠。

使用UK Biobank数据进行分析

将睡眠分类器应用于UK Biobank中的10万名参与者,研究了器械测量的睡眠时长和效率与全因死亡率之间的关系。在66,214名参与者中,观察到1642个死亡事件。短期睡眠者(小时)比正常睡眠时长(6到7.9小时)的参与者具有更高的死亡风险,无论是否存在低睡眠效率(危险比:1.58;95%置信区间:1.19到2.11)还是高睡眠效率(危险比:1.45;95%置信区间:1.16到1.81)。

研究结果

研究发现基于深度学习的睡眠分类技术能够与PSG达到良好的吻合度。即使在不同的内外部验证中,模型也展示出了一定的鲁棒性。具体数据显示,短期的夜间睡眠时长会增加参与者的全因死亡风险,无论其睡眠连续性如何。

睡眠参数与死亡率关联

在452327年的随访中,observed 1642个死亡事件。短期睡眠者(小时)在低睡眠效率(危险比:1.58;95%置信区间:1.19到2.11)和高睡眠效率组(危险比:1.45;95%置信区间:1.16到1.82)中,死亡风险较高。而睡眠效率越高,死亡风险则呈现下降趋势。

讨论与贡献

这项研究的独特之处在于其利用了大规模、多中心的数据,并通过混合使用自监督和深度学习的方法来改进睡眠分类的准确性。结果表明,短期夜间睡眠与较高的死亡风险有关,无论其睡眠效率如何。对于未来的研究,该方法和结果将为大规模加速度计数据库中的睡眠和睡眠结构研究开辟新的方向。

通过这些研究结果,研究人员不仅验证了深度学习模型在睡眠分类中的有效性,还突出了短期夜间睡眠与死亡率之间的明显关联。此项研究为睡眠监测和健康关联的研究提供了强有力的工具和证据。

结论

本文通过开发和验证一种自监督深度学习方法来改进加速度计睡眠分类技术,并通过UK Biobank中的大规模数据验证了这一方法的效果。研究强调了短期夜间睡眠对健康的显著影响,为后续研究提供了重要的基础数据和方法论支持。

研究细节与工具

研究利用了自监督深度学习模型(sleepnet),通过多任务自监督学习和循环神经网络(RNN)进行特征提取与分类。这些方法在英国生物样本库的70万人天数据上进行了训练和验证。此外,研究采用了随机森林模型(Random Forest)在无标记自由生活数据上的窗口识别,进一步提高了分类准确性。

此研究的成果为未来的大规模睡眠健康监测与分析奠定了基础,是一种既实用又高效的方法创新。该研究提供的开源算法和睡眠参数,将推动睡眠和睡眠结构与健康结果的关系研究,为改善全民健康提供新的科学依据。