分享自:

机器学习在重症急性胰腺炎早期预测中的应用

期刊:PancreatologyDOI:10.1016/j.pan.2021.10.003

这篇文章属于类型a:单一原创研究的报告。


关于《Pancreatology》的研究文章:通过机器学习早期预测重症急性胰腺炎的研究

本报告将对《Pancreatology》期刊2022年第22卷第43-50页发表的论文“Early Prediction of Severe Acute Pancreatitis Using Machine Learning”进行介绍,并详细解读其研究内容、流程、结果及意义。

一、研究作者及期刊

该研究由Rahul Thapa、Zohora Iqbal、Anurag Garikipati、Anna Siefkas、Jana Hoffman、Qingqing Mao和Ritankar Das等人完成,所有作者隶属于Dascena公司,总部位于美国德克萨斯州休斯敦。本文以开放获取形式发表于2022年《Pancreatology》期刊,具体上线时间为2021年10月16日。


二、研究背景

急性胰腺炎(Acute Pancreatitis, AP)是一种常见的胰腺急性炎症,近年来在美国的发病率持续增加,每年超过275,000例病例住院治疗。急性胰腺炎可根据严重程度分为轻度急性胰腺炎(Mild Acute Pancreatitis, MAP)、中度重症急性胰腺炎(Moderately Severe Acute Pancreatitis, MSAP)和重症急性胰腺炎(Severe Acute Pancreatitis, SAP)。其中,SAP具有高达30%的死亡率,并常导致持续性器官功能障碍,需要住院治疗和重症监护。

尽管医学界已有多种风险评分系统(如Ranson评分、APACHE II评分、BISAP评分等)用以对SAP患者进行风险分层,但这些方法普遍存在准确性不足、耗时或依赖复杂数据的缺点,导致临床早期干预能力受限。为此,该研究旨在探索用机器学习(Machine Learning, ML)方法构建全新的早期风险预测模型,在患者入院后12小时内预测是否发展为SAP。


三、研究流程

1. 数据收集与处理

研究团队获取了2007年至2020年间来自美国700多个医疗机构的电子健康记录(Electronic Health Records, EHR)。研究共包含4,522,861次有效患者就诊记录,其中618,494例被诊断为急性胰腺炎(AP)。记录依照美国健康保险便携与责任法案(HIPAA)进行了去标识化处理。

为了训练和测试机器学习算法,研究仅选择了符合以下条件的患者: 1. 入院年龄≥18岁; 2. 急性胰腺炎的初步诊断在入院12小时内完成; 3. 住院时间≥48小时。

满足上述条件后,总共纳入61,894名患者用于模型训练与测试,其中37,189例用于最终模型测试,751例确诊为SAP。

2. 机器学习模型的构建与比较

研究开发了三种机器学习算法模型,分别是: - 基于梯度提升(Gradient Boosting)的XGBoost模型; - 逻辑回归(Logistic Regression, LR)模型; - 前馈神经网络(Feedforward Artificial Neural Network, NN)模型。

这些模型以421种EHR特征数据(包含患者人口学信息、生理指标、实验室检验值等)为训练输入,最终经过特征选择后优化至30个重要特征。在此基础上,采用90%训练集和10%测试集的划分进行模型训练和性能评估。

此外,研究还将这些模型与两种传统评分系统Harmless Acute Pancreatitis Score(HAPS)和Bedside Index for Severity in Acute Pancreatitis(BISAP)进行比较。

3. 测试指标与分析方法

模型性能主要通过受试者工作特征曲线下的面积(AUROC)进行评价,同时分析灵敏度、特异度、正负似然比和诊断比值比等指标。同时,研究通过Shapley Additive Explanations(SHAP)方法探讨各特征对模型输出的重要性。


四、研究结果

1. 模型性能比较

模型在测试集上的表现如下: - XGBoost模型的AUROC最高,达到0.921,灵敏度为85.1%,特异度为83.0%; - 逻辑回归模型的AUROC为0.780; - 神经网络模型的AUROC为0.811; - 传统评分系统HAPS和BISAP的AUROC分别仅为0.533和0.682。

实验表明,XGBoost模型在诊断SAP方面远优于传统评分系统和其他机器学习模型。

2. 重要特征解释

基于SHAP分析得出: - 对于XGBoost模型,以下特征对预测结果贡献最大: - 外周血氧饱和度(Peripheral Oxygen Saturation, SpO2) - 入院时腹痛诊断 - 白细胞计数(WBC) - 血红细胞比容(Hematocrit, HCT) - 血脂酶值(Lipase)

SpO2特征在SAP预测中尤为重要,这与SAP患者常见的呼吸并发症(如低氧血症及急性呼吸窘迫综合征)的早期表现一致。

3. 分层风险分析

数据分析显示,SAP患者入院时更常伴有腹痛、恶心呕吐等临床表现,而血液指标(如白细胞计数、血脂酶)增高频率明显高于轻度至中度急性胰腺炎患者。


五、结论与意义

1. 研究结论

研究成功开发了一种基于XGBoost的机器学习模型,可在患者住院后12小时内高效预测SAP发展。相比传统的HAPS和BISAP评分,机器学习模型展现了显著的预测优势,灵敏度与特异度均保持较高准确性。

2. 科学与应用价值

本研究的意义在于: - 实现急性胰腺炎患者的早期风险分层,助力精准医疗; - 减少疾病临床诊断时延,从而为SAP患者争取更多干预和治疗时间; - 为临床资源分配提供科学依据,优化医疗体系效率。

该成果为融合医疗大数据与先进算法的疾病管理提供了新视角,未来在实际临床环境中的应用前景广阔。


六、研究亮点

  • 创新性:首次将机器学习模型引入SAP早期预测领域;
  • 效率高:仅依赖常规EHR数据,操作简便;
  • 数据覆盖广:包含超过60万次患者记录,是目前为止最大规模的AP人工智能研究之一。

七、局限性与未来展望

本文仍存在以下不足: 1. 金标准采用基于SIRS的定义,未来可引入其他SAP诊断标准(如Marshall评分)进一步验证; 2. 数据研究为回顾性分析,模型的真实临床前瞻性表现仍需进一步验证; 3. 未能使用部分重要生物标志物(如CRP、PCT),增加数据完整性将有助于提高模型预测水平。

研究团队提议未来结合多中心、前瞻性临床试验验证模型性能,并开发更易部署于临床系统的预测工具,以进一步推动模型的应用落地。


设计精确、干预及时是重症急性胰腺炎治疗的关键,本研究通过机器学习技术提供了临床决策支持的新方向,为现代化医疗的快速发展奠定了技术基础。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com