本文(Perspective: Toward AI foundation models for epidemics: promise, challenges, and paths forward)由Max S. Y. Lau(埃默里大学)、C. Jessica E. Metcalf(普林斯顿大学)、Zewen Liu(埃默里大学)、Bryan T. Grenfell(普林斯顿大学)和Wei Jin(埃默里大学)共同撰写,于2026年3月13日发表在《PNAS》期刊上。这是一篇关于将人工智能基础模型(AI foundation models)应用于流行病学建模的前瞻性观点文章,旨在探讨其潜力、分析当前面临的挑战,并提出具体的发展路径。作者们在文中提出,虽然基础模型已在自然语言处理、天气预测、生物医学等多个领域引发变革,但流行病学建模尚未经历类似的范式转换,并论证了开发“流行病学基础模型”的必要性、可行性以及需要跨越的关键障碍。
本论文的核心观点围绕“为什么需要”、“主要挑战是什么”以及“如何实现”流行病学基础模型(Epidemic Foundation Models, EFMs)展开。其主要论点可概括如下。
一、 愿景与动机:为何需要流行病学基础模型? 作者开篇指出,传统流行病学模型大多针对特定病原体、在特定环境下独立训练,缺乏泛化能力。新冠(SARS-CoV-2)大流行、麻疹在美国的再现以及2022年全球猴痘(mpox)疫情都突显了传统模型在应对新发、突发传染病时的局限——它们往往需要大量数据和精细调校,难以为快速决策提供及时洞察。相比之下,基础模型(如GPT、GenCast、AlphaFold)通过在广泛、异构的数据上进行大规模预训练,能够学习到通用表征,并只需少量数据即可适应新任务。因此,作者提出一个核心愿景:能否构建一个单一的、经过预训练的模型,来捕捉不同病原体、人群和环境中传染病动力学的共享原理?这样的模型可以通过极少的特定数据(fine-tuning)进行微调,从而在资源有限的环境中也能实现更快速的预测、推断和响应,加强全球卫生安全。这个愿景将基础模型的范式从语言、图像等领域,延伸至复杂的、动力学的流行病学系统。
二、 核心挑战:构建流行病学基础模型面临哪些独特难题? 作者详尽分析了流行病学系统区别于其他成功应用基础模型的领域的根本性挑战,并归纳为四大核心难点。 * 非平稳性动态(Nonstationary Dynamics):与语言等遵循相对稳定分布模式的领域不同,传染病的动态过程其统计特性会随时间演变。这种非平稳性不仅源于环境或季节性驱动因素,更源于生物学、行为学和政策干预之间复杂且快速的反馈循环。例如,人类行为会随风险感知或政策而改变,群体免疫会通过感染、疫苗接种或保护力衰减而演变,公共卫生行动会突然改变接触结构和报告实践。这导致数据生成过程高度动态,使得模型即使在历史数据上表现良好,也可能在新环境或未来时期产生“自信的错误预测”。因此,EFMs必须能够检测变化中的机制并适应演变的流行病学条件。 * 数据稀疏性与碎片化(Data Sparsity and Fragmentation):流行病学数据通常是不完整、报告不一致、跨地区差异大且缺乏标准化元数据的。例如,报告的时覆盖范围或报告率不均衡,监测质量在国家与地区间差异显著,地理标识符、时间格式等元数据缺乏统一标准。这与计算机视觉或自然语言处理等领域拥有大规模、精心策划的训练语料库形成鲜明对比。数据生态的缺失阻碍了有效的模型预训练和可复现的评估,使得系统性开发、基准测试和比较模型变得困难。 * 多元动态机制并存(Presence of Diverse Dynamical Regimes):不同病原体表现出截然不同的流行病学和进化动态。例如,登革热受媒介传播、多血清型动态以及宿主-媒介耦合、气候驱动和免疫介导反馈的共同影响;SARS-CoV-2的特点是免疫压力下的快速抗原进化;麻疹则表现出由部分免疫人群中非线性易感者耗竭导致的低维混沌动态。因此,一个EFM必须能够学习捕捉共享传播原理(如SIR模型族所预测的易感者耗竭)的通用表征,同时也要能容纳由异质性和内在机制产生的、在性质上和结构上都不同的动态机制。 * 复杂因果与机制关系及可解释性要求(Complex Causal Relationships and Interpretability):流行病学动态是高度非线性的,由传播过程、进化动态、环境条件、行为反应和公共卫生干预之间的复杂相互作用(通常是反馈循环)所塑造。例如,报告病例数的下降可能反映了传播的真实减少、季节性效应、检测行为的变化或其组合。同时,与许多只需预测性能的领域不同,公共卫生决策必须建立在因果理解之上。传统的机制模型(如仓室模型)因其可解释性和可操作性而受到信赖。因此,EFMs需要在纯粹依靠数据驱动的“黑箱”模式学习器与流行病学领域对机制洞察的需求之间找到平衡,发展能够结合现代AI表征/预测能力与领域相关性和因果透明度的半机制混合方法。
三、 可行性:为何现在是构建流行病学基础模型的恰当时机? 尽管挑战巨大,作者论证了这一愿景不仅是期望,而且日益可行,主要基于三点。 1. 共享的流行病学原理:尽管疾病在病因、传播模式和进化动态上存在差异,但它们在传播驱动因素(如季节性、人口流动、接触结构、疫苗接种等干预措施)上存在共性。大多数感染都遵循着一种易感-感染-康复/易感(SIRS)的进展机制,由有限的参数集(如传播率、免疫持续时间、接触强度)控制。这些反复出现的特征为学习流行病学动态的通用表征提供了基础框架。 2. 数据生态的扩展:尽管单个疫情数据集仍然稀疏,但全球流行病学数据的广度和多样性已急剧扩展。涵盖了历史疫情记录、基因组监测、血清学、移动数据、废水监测和环境协变量在内的广泛、异构数据集,如今在许多病原体和地区都可用。虽然每个数据流单独都不充分,但这些不完美数据集的累积广度使得构建EFMs比十年前更具可能性。同时,开放数据标准的日益普及也为跨病原体和区域的可扩展预训练和可重复评估奠定了基础。 3. 概念验证与早期实证:已有早期研究工作证明了EFMs的可行性和前景。例如,作者提到的CAPE模型,它利用Transformer架构,在17种不同疾病(12种呼吸道和5种非呼吸道)的数据上进行预训练,并在包括未见过的COVID-19在内的多种疾病上进行微调,展示了单一预训练主干网络可用于多种病原体感染预测的能力。类似的工作如PEMS也共享了相关的动机和框架。这些早期尝试虽仍主要聚焦于单一任务(感染预测),并面临上述诸多挑战,但为下一代更强大的EFMs指明了方向,提供了蓝图。
四、 发展路径:如何克服挑战,构建下一代流行病学基础模型? 针对前述挑战,作者提出了一系列算法创新方向和超越算法的必要投入,构成了通向EFMs的路线图。 * 应对非平稳动态:可引入元学习,通过让模型在大量多样化疫情情景(如不同传播性、季节性、干预时机、人口结构)上进行训练,使其学会快速适应新暴发条件的策略。此外,持续学习范式可使模型在流行病学驱动因素发生根本性变化时(如新变异株出现、政策变更),能够从新的数据流中增量学习并重新校准,同时保留过去的核心知识。 * 应对数据稀疏与碎片化:首先需要通过先进的数据增强、插补方法以及利用大型语言模型的元数据协调能力,来改进和标准化现有数据集。在模型架构上,基于Transformer的骨干网络因其注意力机制能够融合不规则时间序列、空间信息和多模态输入,并能处理缺失条目,成为自然选择。更有效的自监督或半监督学习范式,以及利用基于流行病学原理的大规模合成数据模拟来扩充稀疏的真实观测,都是关键策略。合成数据可以涵盖广泛的暴发机制,为模型训练和评估提供丰富的基底,并可用于压力测试和反事实情景生成。 * 应对多元动态机制:可以开发模块化基础模型,例如采用专家混合模型架构。MoE包含多个专门处理不同类型传播动态的专家子网络,以及一个学习如何为给定输入选择、路由或组合最相关专家输出的门控网络。这种结构使得基础模型能够动态激活适合特定病原体类型的专家通路,同时在一个统一框架内捕捉共享模式。专家和门控网络还可以由结构化的病原体描述符(如传播模式、典型潜伏期、基本再生数)引导,以提供强有力的生物学背景,从而提高对新发或进化病原体的泛化能力。 * 应对复杂因果与确保可解释性:需要发展能够推断和表征因果关系而不仅仅是相关性的模型。一方面,可以利用存在潜在混杂因素下的因果发现方法。另一方面,将流行病学原理明确整合进来的混合机制-数据驱动框架提供了一条稳健的路径。例如,流行病学感知的深度神经网络,通过在标准数据驱动损失函数中增加一个机制约束损失,引导模型的内部表征符合已确立的流行病学规律(如推断的传播率非负、易感者耗竭)。此外,整合强大的可解释AI方法,如Shapley值,可以为模型的预测提供定量归因,揭示每个输入特征(如移动性增加、疫苗接种活动时机)对特定预测的具体贡献,这对于建立决策信任至关重要。
五、 超越算法:实现潜力所需的基础设施与社区建设 作者强调,要充分释放流行病学基础模型的潜力,仅有算法进步是不够的,还需要在基础设施和社区层面进行关键投资。 * 数据标准化与开放获取:迫切需要建立跨疾病、地理和时间的标准化、开放获取的流行病学数据集。公共数据存储库应整合与传播动态相关的多种数据模态(如报告病例、住院/死亡、基因组/血清学数据、废水数据、环境/气候指标、干预记录),并遵循FAIR原则(可发现、可访问、可互操作、可重用)。对于敏感数据,需要发展隐私保护的数据共享框架(如联邦学习、差分隐私)。 * 共享基准与评估标准:该领域必须建立共享的基准和评估协议。这些基准不仅要评估预测准确性,还应强调在分布偏移下的模型可靠性、不确定性校准和可解释性的定量测量。评估应包括对模型泛化能力的严格测试:少样本/零样本适应新暴发的能力、跨病原体和地理区域的迁移能力,以及反事实有效性——模拟未实施的干预措施并产生在流行病学上合理结果的能力。 * 跨学科协作与人才培养:构建有效的EFMs需要整合机器学习、AI与流行病学、进化生物学、公共卫生、计算机科学、行为科学等领域的专业知识。需要发展有目的的协作结构,如跨学科联盟、嵌入式交流项目,并改革教育和培训课程,培养能够流畅跨越多个领域的新一代研究人员。联合资助机制对于维持这些合作至关重要。 * 透明的决策支持系统:建模界和公共卫生机构必须共同开发透明的决策支持系统。模型的输出必须保持可解释性和不确定性感知,清晰地传达不确定性和假设。长期可持续性依赖于建立包括公共卫生机构、学术机构和国际伙伴在内的联盟治理模式,以确保一致的评估、伦理监督和建模工具的公平获取。最终,EFMs应增强而非取代专家判断,提供可解释的、经不确定性校准的见解,为公共卫生决策提供信息参考。
六、 结论与意义 本文的论证最终归结为:流行病学基础模型的开发前景广阔,但实现这一前景需要构建深刻理解疫情应对与管理独特需求的模型。如果成功开发,这些模型将成为强大的、可泛化的工具,补充现有的建模工作,特别是在资源有限的环境或快速演变的疫情中,及时、通用的洞察对决策至关重要。即使部分成功,此类模型也能通过揭示最关键的数据缺口,指导对监测系统的针对性投资,从而加速向真正可泛化、跨病原体迁移的流行病学模型的迭代进程。最终的成功将取决于算法进步与在开放数据集、基准标准及跨学科基础设施方面的投资相结合。早期工作如CAPE已证明了特定流行病学预训练的可行性,为未来发展提供了蓝图。前进的道路在于构建不仅可扩展、可泛化,而且透明、可信且能在现实公共卫生环境中发挥作用的模型。只有这样,基础模型才能作为可靠的工具,服务于全球的疫情准备与响应,为加强全球卫生安全提供一条潜在变革性路径。