这篇文档属于类型a,是一篇关于使用人工神经网络(Artificial Neural Networks, ANN)识别COVID-19高风险患者的原创性研究。以下是针对该研究的学术报告:
本研究由Mateo Frausto-Avila(墨西哥国立自治大学应用物理与先进技术中心)、Roberto de J. León-Montiel(墨西哥国立自治大学核科学研究所)、Mario A. Quiroz-Juárez(通讯作者,墨西哥国立自治大学应用物理与先进技术中心)和Alfred B. U’ren(墨西哥国立自治大学核科学研究所)合作完成,发表于Scientific Reports期刊(2025年,卷15,文章编号18005)。
科学领域:本研究属于机器学习(Machine Learning, ML)在流行病学中的应用,结合了医学数据分析和人工智能技术。
研究背景:COVID-19大流行对全球公共卫生系统造成巨大压力,尤其在资源有限的情况下,快速识别高风险患者对优化医疗资源配置至关重要。尽管已有多种机器学习算法用于预测COVID-19患者风险,但多数研究缺乏前瞻性验证,无法证明模型在真实世界动态环境(如病毒变异、疫苗接种率变化)中的鲁棒性。
研究目标:
- 验证一种基于人工神经网络的模型在墨西哥六次流行病学浪潮中对高风险患者的预测能力;
- 评估模型在不同临床阶段(从初次就诊到重症监护)的准确性;
- 探索早期训练数据是否能在后续疫情中保持预测效力。
研究使用墨西哥联邦政府公开的COVID-19患者数据库(2020年5月12日至2023年4月4日),覆盖25,118,719例患者记录,包含:
- 人口统计学数据(如年龄、性别、居住地);
- 临床信息(如合并症、症状出现时间、住院状态);
- 治疗结果(康复或死亡)。
数据预处理:
- 原始数据包含28项特征,剔除7项预测力弱的特征(如妊娠、吸烟史);
- 对剩余21项特征进行数值编码和最小-最大归一化(Min-Max Normalization);
- 根据临床进展分为四个阶段:
- 阶段1:初次就诊,疑似感染;
- 阶段2:确诊COVID-19,可能伴肺炎;
- 阶段3:住院治疗;
- 阶段4:需插管或进入ICU。
神经网络架构:
- 前馈神经网络(Feed-Forward Neural Network),含两层:
- 隐藏层:2个Sigmoid神经元;
- 输出层:2个Softmax神经元(分类输出康复或死亡)。
- 训练参数:
- 损失函数:交叉熵(Cross-Entropy);
- 优化器:缩放共轭梯度反向传播(Scaled Conjugate Gradient Backpropagation);
- 超参数通过试错法手动调整。
训练策略:
- 第一阶段:使用截至2021年1月31日的数据训练初始模型(未重新训练),测试其在后续五次疫情浪潮(EW-2至EW-6)中的表现;
- 第二阶段:逐步扩展训练数据至每次疫情浪潮结束,重新训练模型并比较性能。
研究对比了随机森林(RF)、支持向量机(SVM)和逻辑回归(LR):
- 神经网络(NN)与SVM表现最佳(平均准确率81.01% vs. 80.18%);
- RF和LR在阶段3、4预测中表现较差(表4-8)。
模型在以下动态条件下保持稳定:
- 疫苗接种率变化(墨西哥截至2022年10月接种率为76.04%);
- 病毒变异株更替;
- 治疗方案调整。
科学价值:
- 证实了基于早期数据的神经网络模型在长期疫情中的预测鲁棒性,为未来大流行病的风险分层提供了方法论支持;
- 提出了一种轻量级模型(仅21项特征输入),适用于资源有限的医疗场景。
应用价值:
- 可整合至临床分诊系统,辅助识别需优先干预的高风险患者;
- 模型开源(GitHub),促进跨地区验证与适配。
此研究为机器学习在公共卫生危机中的应用提供了重要范例,其方法论和结论对应对未来流行病具有广泛参考价值。