本文介绍了一项关于双叶轮搅拌式生物反应器优化设计的研究。该研究由华东理工大学生物反应器工程国家重点实验室的顾庆峰、冀硕岩、刘永强、王永波、余俊雄*、王泽建、庄英萍、李超*(*为通讯作者)以及苏州沃美生物科技有限公司的李超合作完成,于2026年发表在《生物资源技术》(Bioresource Technology)期刊上。
一、 研究背景与目标
本研究属于生物过程工程与计算流体力学交叉领域。随着全球生物经济的快速发展,生物制造在制药、食品、材料等关键行业中的规模不断扩大。搅拌式生物反应器作为生物制造的核心设备,其性能直接决定了抗生素、治疗性抗体、重组蛋白等高价值产品的生产效率。在工业生物过程中,反应器不仅是细胞生长的物理容器,更是调节细胞生理状态的关键平台。然而,随着生物过程向高细胞密度、高产量和大规模方向发展,流场的复杂性与细胞生理的敏感性之间的矛盾日益突出。
具体而言,对于典型的需氧发酵,氧气的低溶解度常常使其传质速率成为细胞生长和产物合成的限制因素,因此反应器需要提供高的氧传递效率。另一方面,对于动物细胞和丝状真菌等剪切敏感型细胞,必须精细控制流体剪切应力以防止细胞损伤。此外,在工业规模下,还需要足够的混合强度以消除底物和氧气的浓度梯度,确保培养均一性。因此,基于细胞培养的具体生理和工艺需求定制反应器设计至关重要。在各种设计参数中,叶轮优化因其对流动和传质的直接影响而被认为是最有效的方法之一。
传统的实验方法严重依赖试错,效率低、成本高,极大地限制了新型高性能叶轮的创新与发展。随着计算科学的进步,计算流体动力学(CFD)已成为解析生物反应器内复杂多相流场、表征和优化其设计的重要工具。然而,高保真度CFD模拟的高计算成本限制了其在多参数、多目标工程优化中的广泛应用。近年来,人工智能(AI)和机器学习(ML)的突破为CFD与数据驱动方法的结合提供了新的机遇。通过在有限的CFD生成数据上训练机器学习算法以捕获底层的非线性映射关系,可以构建准确的代理模型,用于快速预测生物反应器性能。进一步将此类代理模型与先进的优化算法结合,能够实现对广阔设计空间的快速虚拟筛选,从而推动高效、理性的工程设计。
本研究旨在解决丝状真菌发酵中高氧需求与剪切敏感性之间的矛盾。具体目标是建立一个集成的CFD-ML-NSGA-II框架,用于共同优化双叶轮搅拌罐中的传质和剪切性能,最终通过实验验证优化设计的有效性,为生物反应器的理性设计提供一种稳健、高效的方法论。
二、 详细研究流程与方法
本研究包含一个系统、完整的工作流程,主要包括以下几个关键步骤:
参数化CFD建模与数据集生成:首先,研究建立了一个参数化的双叶轮搅拌罐生物反应器CFD模型。该模型包含了五个可优化的叶轮几何设计变量:下叶轮叶片倾角(angle1)、上叶轮叶片倾角(angle2)、叶片高度(h)、叶片长度(l)和叶片数量(n)。这些变量的取值范围如表1所示。研究采用拉丁超立方采样方法在设计空间内生成代表性样本点。通过参数化建模和CFD模拟,并经过收敛性筛选,最终获得了包含837个有效样本的高质量数据集。每个样本都通过CFD模拟计算了两个关键性能指标:体积氧传递系数(kLa)和平均剪切应变率(SSR)。CFD模拟在固定的操作条件下进行(搅拌速度650 rpm,通气率1.3 vvm),以隔离叶轮设计对反应器性能的影响。模拟采用了标准k-ε湍流模型、欧拉-欧拉多相流模型以及包含10个离散气泡尺寸组的群体平衡模型(PBM)。
机器学习代理模型的构建与评估:为了建立叶轮几何参数(输入)与反应器性能指标(输出,即kLa和SSR)之间的非线性映射关系,研究评估了六种候选机器学习算法:决策树(DT)、支持向量回归(SVR)、随机森林(RF)、轻量梯度提升机(LightGBM)、极限梯度提升(XGBoost)和人工神经网络(ANN)。所有模型均在Python 3.9环境中开发,使用PyCharm集成开发平台,并基于Optuna框架对每个模型的超参数进行了自动优化,以最小化5折交叉验证的平均平方误差。模型性能使用决定系数(R²)、均方根误差(RMSE)和平均绝对误差(MAE)三个指标进行全面评估。研究基于837个CFD样本的数据集,将数据分为训练集和测试集,对上述六种模型进行了训练和比较。
多目标优化与决策:在获得高精度的代理模型后,研究采用非支配排序遗传算法II(NSGA-II)进行多目标优化。优化问题定义为:在五个设计变量的可行范围内,同时最大化体积氧传递系数(kLa)和最小化平均剪切应变率(SSR)。NSGA-II算法模拟进化机制(选择、交叉、变异)高效探索解空间中的帕累托最优前沿。算法配置为种群大小100,运行50代。优化过程利用上一步选出的最佳代理模型(ANN)来快速预测任何给定几何配置的性能,从而避免了耗时的CFD直接模拟,极大地提高了优化效率。
最优解的验证与实验评估:从NSGA-II算法得到的帕累托最优前沿中,研究采用基于最小欧几里得距离的理想点法,选择了一个最佳折衷解。为了验证该最优解以及整个CFD-ML-NSGA-II优化框架的准确性和可靠性,研究进行了两步验证:首先,对选出的最优叶轮配置进行了独立的CFD模拟,将模拟得到的kLa和SSR值与代理模型的预测值进行对比,以检验代理模型的预测精度。其次,在5升实验室规模的搅拌罐反应器中,使用布拉氏毛霉(Blakeslea trispora)进行β-胡萝卜素发酵实验,对比了优化叶轮与基准叶轮(标准双六直叶涡轮)的实际发酵性能,特别是最终的β-胡萝卜素产量,以确认优化设计在真实生物过程中的效益。
三、 主要研究结果
几何参数的单因素影响分析:通过系统的单因素敏感性分析,明确了各几何参数对kLa和SSR的独立影响。结果表明,增加叶轮尺寸参数(l, h)和叶片数量(n)会导致kLa和SSR同步、单调上升。其中,叶片长度(l)的影响最为显著,从10 mm增加到26 mm时,kLa激增了321.6%,SSR同时增加了115.7%。这归因于叶片加长直接增加了扫掠体积和叶尖速度,显著增强了尾涡和湍流动能,从而有效促进气泡破碎和分散,增加了气液界面面积,但剧烈的湍流波动也不可避免地加剧了局部能量耗散率,导致剪切应力显著上升。相比之下,叶片倾角表现出不同的流动调节机制。无论是调整上叶轮还是下叶轮,从径向(0°)转变为轴向倾斜(±60°)都会导致kLa和SSR同时下降。这是因为大的倾斜角减少了旋转方向上的投影面积,从而减轻了形阻和局部湍流强度,虽然有效缓解了潜在的细胞剪切损伤,但也削弱了气泡分散所需的剪切力,导致传质效率降低。该分析揭示了生物反应器设计中氧传递效率与剪切应力之间固有的权衡关系,表明仅凭直觉调整单个参数不足以同时实现高传质和低剪切,因此必须进行多目标优化。
非线性相关性分析与高精度代理模型构建:基于837个样本的数据集,皮尔逊相关性分析显示,叶片长度是主导因素,与kLa和SSR的相关系数分别达到0.67和0.83。叶片高度呈中等正相关,叶片数量的影响相对较弱。值得注意的是,叶片倾角与kLa仅呈弱负相关,与SSR无显著统计相关性。这并非意味着没有影响,而是揭示了其影响的非线性本质:叶片倾角主要通过调节流型(在径向流和轴向流之间转换)来影响反应器性能,而非简单的线性缩放。在六种机器学习模型的比较中,人工神经网络(ANN)在预测kLa和SSR方面均表现出最高的准确性,测试集上的R²分别达到0.9863和0.9771,因此被选作后续多目标优化的代理模型。
多目标优化结果与决策:利用ANN代理模型和NSGA-II算法进行多目标优化后,得到了由50个非支配解构成的帕累托最优前沿。该前沿清晰地描绘了传质效率与流体剪切性能之间的内在冲突:任何能产生更高kLa的几何修改都不可避免地会导致剪切强度增加。研究采用理想点法,从帕累托前沿中选择了距离理论“理想点”(即同时具有最大氧传递和最小剪切的不可达状态)欧几里得距离最近的解作为最佳折衷方案。对应的最优几何参数为:angle1 = -36°, angle2 = 60°, l = 22.6 mm, h = 21 mm, n = 7。值得注意的是,该优化设计呈现出明显的不对称叶片拓扑结构:上叶轮从径向结构(angle2 = 0°)演变为具有高倾角(angle2 = 60°)的构型, effectively transforming the upper impeller into an axial-flow hydrofoil。与基准对称配置相比,该优化设计在保持剪切速率处于相当水平的同时,将氧传递性能显著提升了98.4%。
优化性能的验证与比较:CFD验证结果表明,优化叶轮的kLa为312.5 h⁻¹,SSR为61.7 s⁻¹。与NSGA-II优化过程中使用的ANN代理模型预测值相比,kLa和SSR的相对误差分别仅为3.1%和1.6%,证实了帕累托解的有效性以及所构建机器学习模型的高预测精度和鲁棒性。在不同操作条件下的性能对比显示,在所有测试条件下,优化叶轮的kLa性能曲线始终位于基准叶轮之上,而SSR曲线始终位于基准叶轮之下,且未出现交叉,表明优化叶轮构型的性能优势在较宽的操作条件下得以保持,具有良好的工程适用性和操作稳健性。发酵实验验证给出了最具说服力的结果:使用优化叶轮配置,经过110小时发酵后,β-胡萝卜素产量达到3193 mg/L,而使用基准叶轮的产量为2438 mg/L,实现了30.9%的产量提升。这直接证实了优化后的叶轮结构在维持高氧传递能力的同时,有效减少了对菌丝体的剪切诱导损伤,从而显著改善了剪切敏感型丝状真菌的发酵性能。
四、 研究结论与意义
本研究成功建立并验证了一个集成了计算流体动力学、机器学习和NSGA-II算法的智能设计框架,用于共同优化双叶轮搅拌生物反应器的传质和剪切性能。该框架利用837个CFD模拟的数据集,确定了人工神经网络作为最优的代理模型(R² > 0.97)。通过多目标优化,确定了一个最优的不对称叶轮配置,该配置使体积氧传递系数提高了98.4%,同时保持了可比的剪切强度。利用布拉氏毛霉进行的发酵验证证实,优化设计显著减轻了剪切损伤,使β-胡萝卜素产量提高了30.9%。
这项研究的科学价值在于,它展示了一种将高保真度物理模拟(CFD)、数据驱动建模(ML)和智能优化算法(NSGA-II)深度融合的系统性工程优化方法论。它为解决生物反应器设计中多目标、多参数、高计算成本的复杂优化问题提供了一个高效、可靠的范式。其应用价值则直接体现在为强化剪切敏感的工业发酵过程提供了关键指导。通过理性设计而非试错,可以显著提升目标产物的产量和过程效率,具有重要的工业应用前景。
五、 研究亮点
六、 其他有价值的讨论
研究在最后部分讨论了该框架的局限性及未来展望,体现了学术研究的严谨性。局限性包括:1) 代理模型的高预测精度依赖于本研究所采样的几何设计空间,在推断至显著不同的叶轮拓扑或流态时需要谨慎;2) 采用基于多重参考系(MRF)的稳态假设以确保大规模数据集生成的计算可行性,该方法平均了瞬态流动结构,未来可采用瞬态滑移网格模拟来深入研究瞬时剪切波动;3) 本研究在实验室规模进行验证,由于静水压力效应和混合不均匀性在大型设备中更为显著,这些优化参数向工业规模生物反应器的直接可转移性需要进一步验证。未来研究将侧重于集成多尺度建模策略以应对这些放大挑战。这些讨论为后续研究指明了方向。