基于离体肺灌注数据构建人体肺数字孪生体以精准评估治疗效果

分享自：
基于离体肺灌注数据构建人体肺数字孪生体以精准评估治疗效果

期刊:nature biotechnologyDOI:10.1038/s41587-026-03121-4
本研究由Xuanzi Zhou、Bo Wang、Yiyang Wei、Serena Hacker、Sumin Kim、Thomas Borrillo、Abby McCaig、Haaniya Ahmed、Youxue Ren、Olivia Hough、Luca Orsini、Bonnie T. Chao、Micheal McInnis、Marcelo Cypel、Mingyao Liu、Jonathan C. Yeung、Lorenzo Del Sorbo、Shaf Keshavjee和Andrew T. Sage等作者共同完成，他们主要来自加拿大多伦多大学健康网络（University Health Network）的拉特纳胸科研究实验室和多伦多肺移植项目，以及其他相关院系。该研究成果于2026年（接受日期）发表在*Nature Biotechnology*期刊上。
这项研究的学术背景是生物医学工程和精准医疗领域中的数字孪生（Digital Twin）技术。数字孪生是一个新兴概念，旨在整合分子、生理、功能和临床数据，为生物系统（如细胞、器官乃至个体）创建计算模型。然而，此前在医学领域，由于缺乏大规模、多模态的数据集，构建能够全面模拟复杂生物系统的高保真多尺度数字孪生尚未实现。与此同时，离体肺灌注（Ex Vivo Lung Perfusion， EVLP）技术为这一目标提供了独特的机会。EVLP允许在生理条件下于体外研究人类肺脏，并能从影像学、生理监测和分子检测中生成多模态数据。研究团队利用已知最大的临床EVLP数据集，探索开发高保真的人肺数字孪生的可行性。该研究的主要目标是：开发并验证一个基于EVLP数据的人肺数字孪生框架；评估该数字孪生在准确模拟多种肺功能参数方面的能力；并最终证明其在评估个体化治疗效果（以阿替普酶治疗为例）方面的应用价值。
详细的研究工作流程包括多个关键环节，涵盖了数据采集、模型开发、验证和实际应用。 第一，研究队列与数据生成。研究纳入了总计951例用于评估移植适应性的孤立人肺EVLP案例，这些肺脏来自无肺部特异性疾病的器官捐献者。所有肺脏在EVLP回路中至少进行了3小时的多模态功能评估。EVLP系统是一个封闭回路，在37°C下使用含细胞的灌注液灌注离体肺，并通过重症监护级别的机械通气机让肺“呼吸”。在此过程中，系统集成了多种传感器并采集生物样本（如组织和灌注液），从而产生了跨越分子到功能测量的多尺度数据。具体生成的数据模态包括：①生理学数据：通过呼吸机以100Hz高频率采集的气道压力、流速波形，以及每小时监测的血管压力（肺动脉压、左心房压）、血气分压（氧分压、二氧化碳分压）和肺水肿（通过灌注液损失量估算）。②生物化学数据：每小时从灌注液中检测的电解质（钙、钾、氯、钠）和酸碱指标（pH、碳酸氢盐、碱剩余）。③影像学数据：在灌注第1小时和第3小时拍摄的肺部X光片。④组学数据：包括代谢组学（灌注液中的葡萄糖和乳酸水平）、蛋白质组学（使用多重ELISA检测灌注液中的炎症蛋白生物标志物，如IL-6、IL-8、IL-1β、IL-10）和转录组学（在EVLP前后采集肺组织活检，通过微阵列分析获取转录组数据，并使用单样本基因集富集分析计算与肺部疾病相关的特定信号通路富集分数）。所有数据的采集频率、量化方法和样本规模均在补充材料中详列。这是一个庞大而全面的多模态器官特异性数据集，为数字孪生开发奠定了基础。 第二，数据预处理与特征工程。研究团队构建了自动化的Python数据处理流程。对于高频呼吸机波形，首先进行呼吸分割，将波形划分为单个呼吸周期，并为其分配临床标签（如“常规呼吸”、“评估期呼吸”）。接着，应用基于物理原理的力学方程从分割后的波形中计算衍生参数，如动态顺应性、峰值/平均气道压力、呼气潮气量等。这构成了物理信息建模的基础。对于X光影像，使用卷积神经网络（CNN，ResNet-50）提取潜在特征，并通过主成分分析获取前10个主成分作为图像特征。转录组数据则通过基因集富集分析转化为特定通路的富集分数。 第三，数字孪生模型开发。研究采用了一种混合物理信息机器学习架构来构建数字孪生。这结合了基于物理的模型（用于从原始波形计算可解释的生理参数）和数据驱动的机器学习模型（用于预测分子、生理和影像数据）。模型框架支持两种模式：①静态数字孪生：仅使用基线（如第1小时）数据来模拟未来的肺功能，不纳入新测量值。②动态数字孪生：使用实时EVLP数据持续重新校准，基于最近的测量值预测下一个时间点的功能。这类似于长期与短期天气预报的区别。具体到不同数据类型的预测：对于高频生理参数（如每呼吸的顺应性），采用门控循环单元（Gated Recurrent Unit, GRU）模型进行时间序列预测。对于每小时采集的指标（如血气、生化指标、影像主成分），则使用XGBoost模型。对于转录组变化，使用基线转录组数据结合EVLP功能测量来预测EVLP后的通路富集分数。模型通过20折交叉验证进行训练和优化，并对超参数进行了广泛搜索以确保校准。所有代码已在GitHub开源，并部署为一个基于Web的交互式应用程序以供使用。 第四，模型验证。为确保模型的准确性和泛化能力，研究进行了多层面验证：1. 内部性能评估：在训练集上通过交叉验证评估预测误差，报告平均绝对误差（MAE）和平均绝对百分比误差（MAPE）。2. 模拟队列验证：使用k近邻方法基于历史数据生成了50个模拟肺脏轮廓，并在其上测试数字孪生，结果与训练性能一致。3. 独立测试集验证：使用一个包含45例临床EVLP案例的独立队列进行测试，其预测误差与训练阶段的交叉验证结果相符，证明了模型的有效性和泛化性。4. 临床基准对比：将数字孪生的预测误差与传统小型对照组（随机抽取5个肺脏）中观察到的病例间变异系数（%CV）进行比较，结果显示数字孪生的误差分布更窄，精度更高。 第五，治疗疗效评估应用。为了展示数字孪生在临床前研究中的价值，研究团队将其应用于评估溶栓药物阿替普酶（Alteplase）在EVLP期间治疗疑似肺栓塞（Pulmonary Embolism, PE）的疗效和安全性。在临床实践中，共有16例EVLP肺脏接受了阿替普酶治疗（给药在基线评估后）。研究采用“反事实推理”思路：利用治疗前（第1小时）的基线数据，通过数字孪生模拟该肺脏如果未接受治疗在第2、3小时的功能状态（特别是肺动脉压和肺水肿），以此作为个体化的虚拟对照。然后，将药物治疗后实际观察到的值与数字孪生预测的未治疗值进行配对比较，从而量化个体治疗效应。同时，研究也将治疗组与一个随机选择的传统对照组（n=6）进行了常规的队列间比较，以凸显数字孪生方法的优势。
研究的主要结果详细展示了数字孪生框架在各个层面的预测精度及其在疗效评估中的成功应用。 在肺功能参数预测准确性方面，数字孪生展现出卓越的性能。对于生理学参数，混合模型准确预测了13个指标。例如，基于GRU的每呼吸参数预测中，动态顺应性、峰值气道压力和呼气潮气量的MAPE分别在6.2%、3.7%和2.0%（动态孪生）。每小时测量的气体交换（氧分压、二氧化碳分压）和血管压力的预测MAPE在4.7%至10%之间。肺水肿的预测平均绝对误差约为31毫升。生物化学参数的预测同样精准，动态数字孪生对所有电解质和酸碱指标的预测MAPE在0.46%至7.2%之间，其中pH值的预测误差极低（MAPE 0.46%）。在组学数据预测上：①代谢组学生物标志物（葡萄糖和乳酸）的预测MAPE分别为4.9%和6.9%。②转录组学方面，数字孪生能够高精度预测10个与肺病相关信号通路（如低氧、TGFβ信号、p53信号、炎症反应等）的富集分数变化，MAPE在1-3%之间。更重要的是，数字孪生能以79-100%的准确率正确识别这些通路富集程度的时间变化方向（如上调或下调）。③蛋白生物标志物（IL-6, IL-8, IL-1β, IL-10）的浓度预测也显示出合理的误差范围。在影像学特征预测上，数字孪生预测的第3小时图像主成分与实际主成分高度相关，并且这些预测的主成分与实际临床影像学发现（如实变、浸润）和诊断（如吸入性肺炎、肺炎）同样存在强相关性，证明了数字孪生捕捉到的影像特征具有临床意义。 在模型验证结果方面，残差分析显示预测误差的均值与零无显著差异，表明没有系统性偏差。与模拟队列和独立测试集的比较均证实了模型的稳健性。与小型传统对照组变异系数的对比表明，数字孪生提供的预测比依赖小样本对照组间比较具有更高的精确度和更低的变异。 最具说服力的结果是数字孪生在治疗评估中的应用。研究以肺动脉压（PAP）作为疗效主要终点，肺水肿作为安全性指标。传统队列分析（阿替普酶治疗组 vs. 随机对照组）显示，治疗后1小时和2小时，两组的PAP和肺水肿均无统计学显著差异（p值>0.05）。然而，当使用数字孪生作为个性化对照进行配对分析时，结果显示在治疗后2小时，治疗组的PAP显著低于其对应数字孪生预测的未治疗值（p=0.031）。亚组分析进一步揭示，这种治疗效果仅在最终被评估为适合移植、具有良好临床结局的肺脏中观察到；而在不适合移植、结局较差的肺脏中，未显示出阿替普酶的疗效。安全性方面，治疗组与数字孪生预测的肺水肿值无显著差异，表明药物未引起额外的肺水肿，安全性良好。这一发现至关重要，因为它表明数字孪生方法能够在仅6个治疗病例的小样本中，检测到传统对照组方法无法发现的显著治疗效果。据估算，若使用传统方法要达到相同结论，可能需要至少18个病例（样本量增加三倍）。这凸显了数字孪生在提高统计效能和研究效率方面的巨大潜力。
本研究的结论是，基于离体肺灌注（EVLP）平台生成的多模态数据，可以成功创建高保真的人类肺脏数字孪生。该数字孪生能够精确模拟跨越生理、生化、影像、转录组、代谢组和蛋白质组等多个维度的超过75个参数。更重要的是，研究通过阿替普酶治疗肺栓塞的真实世界案例验证，首次证明了器官级数字孪生可以作为一种强大的工具，用于临床前治疗效果的个性化、精准化评估。这种方法通过为每个治疗器官提供其自身的“虚拟对照”，克服了传统研究中因器官个体差异大、难以匹配对照以及样本量需求大而带来的挑战。
该研究的科学价值与应用价值非常显著。科学价值在于：1. 首次在器官层面实现了真正意义上的、融合物理机理与数据驱动的混合型数字孪生，推动了医疗数字孪生从概念迈向实际应用。2. 证明了EVLP是生成构建生物系统数字孪生所需大规模多模态数据的理想平台。3. 为复杂生物系统的计算建模提供了一种可扩展的框架，该框架可借鉴用于其他离体灌注器官（如肝、心、肾）。应用价值在于：1. 变革临床前研究：极大提高了药物和疗法在人体器官水平测试的效率和精度，可加速新疗法的开发，减少对动物模型的依赖。2. 精准医疗：为实现“可编辑的数字孪生”铺平道路，未来可通过模拟“如果-那么”场景，为个体患者预测最佳治疗方案。3. 器官移植：增强了对供肺功能的评估和修复策略的测试能力，有助于扩大供肺池和提高移植成功率。
本研究的亮点在于：1. 数据规模和质量的独一无二：基于全球已知最大的临床EVLP数据集（超过1000例），数据模态全面、注释清晰。2. 混合建模框架的创新性：巧妙结合基于物理的方程与数据驱动的AI（XGBoost, GRU），兼具可解释性与处理复杂非线性的能力。3. 研究设计的闭环验证：不仅验证了模型的预测精度，更通过一个真实的治疗干预案例，直接证明了数字孪生在解决实际生物医学问题（疗效评估）上的价值，完成了从“模型构建”到“实际应用”的完整逻辑链条。4. 实用性强的分层架构：数字孪生框架设计为可根据数据可用性灵活配置的模块化结构（仅表格数据、表格+影像、表格+影像+高频波形），增强了其临床部署的可行性。
此外，作者也坦率地讨论了研究的局限性，包括：某些组学数据样本量仍有限、当前模型预测时长限于EVLP常规的几小时内（但可扩展）、数字孪生目前仅模拟靶器官而未考虑全身药代动力学、以及需要更多的外部验证等。他们建议未来的研究可以逐步用数字孪生对照取代部分实体对照，并探索将功能性实体接口标准整合到系统中，以增强模型的互操作性和临床实用性。总体而言，这项研究为在医疗领域建立和运用高保真生物数字孪生树立了一个里程碑式的范例。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问