机器学习预测模型在成人阻塞性睡眠呼吸暂停筛查中的研究进展综述
作者与发表信息
本文由Shiyuan Li、Jiewei Huang、Ziheng Xiao(均来自福建医科大学附属第二医院临床检验中心)及Chunmei Fan(通讯作者)共同完成,发表于2025年10月的期刊*Nature and Science of Sleep*(2025年影响因子未提及)。文章题为《Advances in Machine Learning Prediction Models for the Screening of Obstructive Sleep Apnea in Adults》,是一篇系统性综述,旨在总结机器学习(Machine Learning, ML)在阻塞性睡眠呼吸暂停(Obstructive Sleep Apnea, OSA)诊断中的研究进展。
研究背景与意义
OSA是一种以睡眠中上气道反复塌陷为特征的全球性健康问题,可导致低氧血症、睡眠片段化,并与多种全身性疾病(如心血管疾病、糖尿病)相关。目前,多导睡眠监测(Polysomnography, PSG)是OSA诊断的金标准,但其操作繁琐、成本高昂且难以普及。因此,开发便捷、准确的替代筛查工具成为临床迫切需求。近年来,机器学习在医学领域的应用为OSA的早期识别和分级诊断提供了新思路。本文综述了OSA预测模型的三大核心要素:常用预测因子、机器学习算法选择及模型效能评估,并探讨了当前挑战与未来趋势。
主要观点与论据
1. OSA预测模型的常用预测因子
预测因子是模型构建的基础,本文将其分为五类:
- 人口统计学与问卷数据:包括年龄、性别、颈围(Neck Circumference, NC)、体重指数(Body Mass Index, BMI)及柏林问卷(Berlin Questionnaire, BQ)等。例如,Liu等(2017)基于颈围、腰围、BMI和年龄构建的支持向量机(Support Vector Machine, SVM)模型,对中重度OSA(AHI≥15)的预测AUC达0.92。局限性在于问卷数据存在主观偏差。
- 实验室指标:涵盖炎症标志物(如IL-6)、代谢指标(如甘油三酯)及基因标记。Zhu等(2022)通过基因表达分析筛选出10个关键基因构建的人工神经网络(Artificial Neural Network, ANN)模型,AUC高达0.99,但基因检测成本限制了其普及。
- 并发症数据:如高血压、糖尿病等。Yan等(2022)结合BMI和高血压等并发症的Logistic回归模型,AUC为0.98,凸显并发症的预测价值。
- 影像学数据:包括上气道CT、颅面部3D形态测量等。Kim等(2024)基于鼻窦CT的多模态深度学习模型AUC达0.91,但样本量小(n=818)可能影响泛化性。
- PSG部分通道信号:如单导联心电图(Electrocardiogram, ECG)。Hemrajani等(2023)开发的ECG深度学习模型准确率达89.5%,且可集成至便携设备,适合家庭筛查。
2. 机器学习算法的选择趋势
文章统计了41项研究中58个模型的算法分布:
- 传统算法:逻辑回归(Logistic Regression, LR)占比最高(35/63),因其计算高效且能处理多重共线性,适合结构化数据(如问卷指标)。例如,Huang等(2020)基于SVM的模型在6875例中国患者中AUC为0.82。
- 深度学习:在复杂数据(如ECG、影像)中表现突出。Hou等(2025)提出的Time-Hybrid OSAFormer模型通过单导联ECG信号实现95%的准确率,但依赖大量计算资源。
- 算法选择趋势:2013-2024年间,LR和SVM应用逐渐减少,深度学习占比显著上升(图3),反映算法升级对性能的提升。
3. 模型效能与应用场景
- 筛查模型:多数以AHI≥5为阈值。Fang等(2025)基于模拟鼾声的Transformer算法模型AUC达0.926,优于传统问卷。
- 严重度分级模型:分为多阈值分类(如AHI=15/30)和连续AHI预测两种。Han等(2023)结合K-means聚类与LightGBM算法,对AHI≥30的预测AUC为0.96。
- 临床转化挑战:模型泛化性不足(如种族差异)、缺乏外部验证及解释性差是主要瓶颈。例如,Elwali等(2021)的呼吸音模型仅在加拿大人群验证(n=145),需跨区域验证。
研究价值与未来方向
本文系统梳理了OSA预测模型的研究现状,提出以下方向:
1. 数据整合:结合多领域预测因子(如基因+影像)提升模型全面性。
2. 算法优化:平衡深度学习性能与临床可解释性,如开发混合模型(传统算法+深度学习)。
3. 临床落地:分层应用——基层医疗侧重低成本问卷模型(高灵敏度),专科医院采用高维数据模型(高特异度)。
亮点与局限性
- 亮点:首次全面对比不同预测因子与算法的效能;提出分场景应用框架;纳入2025年最新研究(如Fang的鼾声模型)。
- 局限:未对模型校准度、决策曲线等多维指标进行Meta分析;文献检索仅限PubMed,可能遗漏部分研究。
总结
本文为OSA的机器学习诊断研究提供了系统性参考,强调了从“单一指标”到“多模态融合”、从“理论模型”到“临床转化”的发展路径,为后续研究设计及政策制定提供了重要依据。