类型a:学术研究报告
作者及机构
该研究由浙江大学药学院药物信息学研究所的徐钊、陈杭和瞿海斌*(通讯作者)合作完成,发表于《生物工程学报》(Chinese Journal of Biotechnology),网络首发日期为2025年12月25日,DOI编号为10.13345/j.cjb.250654。研究得到浙江省重点研发计划(2023C03116)的资助。
学术背景
本研究属于生物过程建模与人工智能交叉领域,聚焦单克隆抗体(monoclonal antibodies, mAbs)生产的细胞培养过程优化。单克隆抗体是生物制药的核心产品,2021年全球市场规模达3280亿美元,预计2030年将增长至8530亿美元。然而,传统数据驱动的机器学习模型依赖大量数据且缺乏物理规律约束,而物理信息神经网络(Physics-Informed Neural Networks, PINN)虽能融合机理方程,但在小样本条件下易陷入次优解。因此,本研究旨在开发一种改进的混合物理信息神经网络(SS-IHPINN),通过物理引导初始化和计划采样(Scheduled Sampling, SS)模块提升模型在小样本下的鲁棒性和迁移学习能力。
研究流程
-
数据集构建
-
基于杂交瘤细胞分批补料培养的七阶动力学模型,通过MATLAB仿真生成数据,模拟两种进料模式(同时进料流和独立进料流)。
-
生成8批次含5%高斯噪声的数据,采用8折交叉验证(1批次测试,7批次训练)。为评估泛化能力,额外生成近域(初始设计水平±10%–15%)和远域(±15%–20%)数据集。
-
-
模型设计
-
SS-IHPINN框架:在混合物理信息神经网络(Hybrid-PINN)基础上,引入物理引导初始化(取代零初始化)和计划采样模块。计划采样采用反向Sigmoid衰减策略(公式17),逐步减少对真实数据的依赖。
-
迁移学习:固定物理信息层,微调数据驱动层,适应新工艺参数。
-
-
对比与消融实验
-
性能对比:与门控循环单元(GRU)、物理信息GRU(PI-GRU)、Transformer及物理信息Transformer(PI-Transformer)比较,评估RMSE和R²。
-
消融实验:分析物理引导初始化(IHPINN)和计划采样(SS-HPINN)单独及协同作用的效果。
-
-
开源验证
- 在Asrav开源数据集(污水处理单元和半间歇式反应器)上验证SS-IHPINN的普适性。
主要结果
-
模型性能
-
SS-IHPINN在活细胞密度(x)、乳酸(lac)和单克隆抗体(mab)预测中表现最优(R²>0.90),葡萄糖(glc)和谷氨酰胺(gln)预测显著优于PI-GRU和PI-Transformer(p<0.05)。
-
消融实验显示,物理引导初始化与计划采样的协同作用使RMSE最大降低47%(表3)。
-
-
迁移学习
-
未经微调的SS-IHPINN在外推任务中优于其他模型;微调后,其在近域数据集的RMSE进一步降低51%(表5)。
-
硬约束框架(Hybrid-PINN)虽限制部分适应性,但在变量x预测中仍优于软约束模型。
-
结论与价值
本研究提出的SS-IHPINN通过物理约束与数据驱动的协同优化,显著提升了小样本条件下的建模精度和泛化能力,为生物制药过程的实时监控和工艺优化提供了可靠工具。其科学价值在于:
-
方法创新:首次将计划采样与物理引导初始化结合,解决了PINN在小样本下的次优解问题。
-
应用潜力:在仿真和开源数据集中均验证了鲁棒性,为复杂生物过程建模树立了新范式。
研究亮点
-
多模块协同:物理初始化约束解空间,计划采样增强训练稳定性,二者协同提升性能。
-
跨领域验证:在细胞培养和化工过程(污水处理)中均表现优异,证明方法普适性。
-
迁移学习突破:首次将迁移学习应用于细胞培养的PINN建模,显著降低新任务数据需求。
其他价值
研究揭示了硬约束框架在泛化能力上的权衡,为后续研究(如多目标损失函数优化)提供了方向。此外,代码公开和数据集仿真细节(表1)增强了研究的可重复性。