机器学习驱动的低骨密度临床决策支持:一项结合可解释AI的网页预测模型研究
一、研究团队与发表信息
本研究由Xing Yang(广西壮族自治区人民医院/广西医学科学院健康管理研究所)、Jianyuan Liu(广西医科大学公共卫生学院)、Xiaozhi Huang(广西壮族自治区人民医院健康管理中心)等13位作者共同完成,发表于期刊《Bone》2025年7月刊(Volume 200, 117592)。第一作者Xing Yang、Jianyuan Liu与Xiaozhi Huang贡献均等。
二、学术背景与研究目标
低骨密度(Low Bone Mineral Density, LBMD)包括骨量减少和骨质疏松症,与全球高医疗负担相关。当前诊断方法如双能X线吸收测定法(DXA)存在成本高、可及性差等问题,而世界卫生组织开发的骨折风险评估工具(FRAX)受限于年龄范围和准确性。本研究旨在开发一种基于机器学习(Machine Learning, ML)的可解释预测模型,整合临床易得指标(如年龄、BMI、碱性磷酸酶等),并通过网页应用实现临床决策支持,以提升LBMD筛查的普及性和成本效益。
三、研究流程与方法
1. 数据收集与处理
- 研究对象:纳入广西壮族自治区人民医院2020-2022年接受DXA检测的16,274名参与者,随机分为训练集(70%,n=11,391)和内部验证集(30%,n=4,883)。外部验证集来自美国国家健康与营养调查(NHANES)数据库(n=2,778)。
- 特征选择:通过最小绝对收缩与选择算子(LASSO)回归和多元逻辑回归筛选关键预测因子,最终确定年龄、BMI、总胆固醇和碱性磷酸酶4个变量。
模型开发与比较
可解释性分析
网页应用部署
四、主要研究结果
1. 模型性能
- 逻辑回归(LR)在内部验证集表现最优(AUC=0.902, MCC=0.684, Brier分数=0.123),外部验证集AUC达0.812。
- 决策树(DT)和随机森林(RF)在训练集过拟合(AUC=1.000),验证集性能显著下降,凸显LR的稳健性。
关键预测因子
临床实用性
五、研究结论与价值
本研究开发了一种基于逻辑回归的可解释机器学习模型,仅需4项临床指标即可高效预测LBMD,并通过网页工具实现免费应用。其科学价值在于:
1. 方法学创新:首次在LBMD预测中系统比较10种ML算法,结合SHAP和LIME增强模型透明度。
2. 临床转化:解决了传统DXA和FRAX的局限性,为资源有限地区提供低成本筛查方案。
六、研究亮点
1. 多维度验证:内部与外部数据集验证模型泛化能力。
2. 可解释性驱动:通过SHAP和LIME揭示预测机制,提升临床信任度。
3. 技术整合:从模型开发到网页部署形成完整闭环,推动AI在骨质疏松管理的落地应用。
七、局限性
1. 回顾性设计未纳入生活方式和遗传因素。
2. 数据来源单一(中国广西),需更多地区验证普适性。未来计划扩展多中心数据以优化模型。
此研究为LBMD的早期筛查和干预提供了可靠工具,标志着机器学习在骨健康管理中的实际应用迈出重要一步。