基于CFD与贝叶斯优化的发酵反应器设计操作优化研究
第一部分:研究作者、机构与发表信息
本研究由韩国科学技术院生物分子与化学工程系的Hongbum Choi(第一作者)、忠南大学化学工程与应用化学系的Kosan Roh(通讯作者)以及南加州大学化学工程与材料科学系的Jay H. Lee(通讯作者)共同完成。研究成果以学术论文形式发表,其标题为《CFD‐based determination of optimal design and operating conditions of a fermentation reactor using Bayesian optimization》。该论文发表于学术期刊《Biotechnology and Bioengineering》2025年刊的第122卷,具体出版年份在文本中显示为2025年(在线发表接受日期为2024年12月8日)。本研究得到了韩国CJ Cheiljedang公司的资助。
第二部分:学术背景与研究目的
本研究隶属于生物过程工程与计算流体力学交叉的学科领域,具体聚焦于大规模发酵反应器的优化问题。发酵反应器的效率,尤其是在好氧发酵过程中,极大地受限于气体(通常是氧气)在反应器内的分散情况和反应物浓度分布。随着发酵过程的规模放大,反应器内因混合不均而产生的浓度梯度会变得尤为显著,直接影响到微生物所处的局部微环境,进而对最终的产品产量、生产率和质量产生负面影响。
传统的发酵反应器优化研究通常面临两个主要挑战。其一,许多研究将计算流体力学(Computational Fluid Dynamics, CFD)模拟与发酵过程的动力学模型割裂开来。一些研究仅关注流体力学参数(如气体滞留率、流型),而忽略了底物消耗、产物生成等关键生化反应动力学;另一些研究虽然尝试结合动力学模型,但由于CFD模拟本身计算成本高昂且动力学参数获取困难,通常只能局限于简化的模型或少数几个预设的场景进行比较,缺乏系统性、高效的全局优化手段。其二,由于CFD模拟是计算密集型的“昂贵”评估过程,传统的优化方法(如遗传算法)需要调用数百次CFD模拟,这在工业级设计与优化中构成了巨大的计算瓶颈,难以实际应用。
因此,本研究旨在克服上述局限,其核心目标是:开发一个集成了精确发酵动力学模型的多相CFD模型,用以模拟和预测大规模发酵反应器内的流体动力学与生化反应过程;并在此基础上,应用高效的贝叶斯优化(Bayesian Optimization, BO)算法,以最少的CFD模拟评估次数,系统地确定反应器的最佳设计参数与操作条件,最终实现细胞质量生长率的最大化。本研究以生产O-乙酰-L-高丝氨酸的批式发酵过程为具体案例,展示了这一集成优化框架的有效性与实用性。
第三部分:详细研究流程与方法
本研究的工作流程是一个多步骤的集成建模与优化过程,主要包括以下四个关键环节:
1. 发酵动力学模型的建立与参数估计 研究首先需要建立一个能够准确描述目标发酵过程的数学模型。该过程使用谷氨酸棒状杆菌(Corynebacterium)作为菌株,以O-乙酰-L-高丝氨酸为目标产物。细胞利用两种底物——蔗糖(S1)和乙酸(S2)以及氧气进行生长和产物的合成。研究者构建了一个包含细胞、两种底物、产物和溶解氧的组分质量衡算方程组。细胞比生长速率模型采用了对双底物的竞争性抑制模型,产物生成速率则采用Luedeking-Piret方程进行描述,该方程将产物生成与细胞生长速率和维持代谢相关联。该动力学模型共包含11个待估参数。
研究的关键实验数据由其合作伙伴公司提供,包括一个两阶段的补料分批培养实验数据:初始的批式反应阶段和随后的补料分批阶段。研究者使用Levenberg-Marquardt算法,同时利用这两个阶段的实验数据对所有11个动力学模型参数进行了同步估计。拟合结果显示,模型对细胞浓度(X)、产物浓度(P)以及两种底物浓度(S1, S2)的预测与实验数据吻合度极高,决定系数(R²)分别达到0.96、1.0、1.0和1.0,证明了所开发动力学模型的准确性,为后续与CFD的耦合提供了可靠的生化反应源项。
2. 集成动力学模型的多相CFD模型构建 在获得可靠的动力学模型后,研究建立了一个中试规模(3 m³)的批式发酵反应器的CFD模型,该规模是实验室规模(30 L)的100倍放大,并假设动力学保持不变。模型在Ansys Fluent 2021 R2中实现。 * 几何与网格:反应器配备有三个Rushton涡轮搅拌桨和四个挡板。关键设计变量包括挡板宽度(B)、搅拌桨间距(S)和搅拌桨直径(D)。网格数量在150万到170万之间,随设计变量的改变而调整。 * 多相流与湍流模型:采用欧拉-欧拉两相流方法模拟气-液体系,气相为氧气气泡。湍流模型选用适用于分散相的标准k-ε模型。气泡尺寸设定为固定的5 mm。 * 动力学模型耦合:这是本研究的核心创新之一。将第一步中建立的发酵动力学微分方程组(描述细胞生长、底物消耗和产物生成的源项)完全耦合到CFD的物种输运方程中。这意味着在CFD模拟的每一个计算单元内,都会根据当地的流体条件(如气含率、流速)和物质浓度,实时计算生化反应速率。为了处理反应时间尺度(长)与流动时间尺度(短)的差异,模拟采用了拟稳态策略:首先关闭动力学源项,只计算流场和气体分散,直至达到收敛的流型;然后,在收敛的流场基础上,激活动力学模型进行计算,以评估在特定设计/操作条件下,整个反应器内的细胞生长状况。 * 特殊处理:为了更真实地反映氧气限制的影响,研究设定了一个判据:当某区域的氧气体积分数低于0.01时,认为该区域处于“气体死区”,发酵反应(动力学源项)不会发生。这避免了稳态模拟无法动态反映氧气耗竭的问题。
3. 优化问题的定义与贝叶斯优化算法的应用 研究确定了五个连续变量作为优化对象:三个设计变量(挡板宽度B、搅拌桨间距S、搅拌桨直径D)和两个操作变量(通气速率Q、搅拌转速N)。优化目标是最大化整个反应器液相体积积分得到的细胞质量生长率M(X)。每个变量都有基于工程常识设定的上下界。 为应对CFD模拟“评估昂贵”的挑战,本研究没有采用需要大量模拟的传统优化算法,而是引入了贝叶斯优化(BO)。BO是一种高效的序列全局优化策略,特别适用于黑箱函数。其核心流程如下: * 初始化:首先,使用拉丁超立方采样(Latin Hypercube Sampling, LHS)生成少量(本研究为5个)初始样本点,并对每个点进行CFD模拟,得到初始的输入(五个变量)-输出(M(X))数据。 * 构建代理模型:利用已获得的数据,构建一个高斯过程(Gaussian Process, GP)回归模型作为目标函数的代理模型。GP模型不仅给出任何未采样点的预测值(均值),还给出了预测的不确定性(方差)。 * 采集函数与选点:基于当前的GP模型,通过优化一个称为“采集函数”的准则来选择下一个最有价值的评估点。本研究采用上置信界(Upper Confidence Bound, UCB)作为采集函数,它能平衡“利用”(在预测值高的区域采样)和“探索”(在不确定性大的区域采样)。选择能使UCB最大的点作为下一个CFD模拟的候选点。 * 迭代更新:对新选出的点进行CFD模拟,得到真实的M(X)值,然后将这个新数据点加入数据集,并更新GP模型。如此循环迭代,逐步逼近全局最优解。整个优化过程仅用了较少的CFD模拟次数(共约32次评估,包含初始点)就找到了显著优于传统实验设计方法的结果。
4. 对比基准:传统实验设计分析 为了评估贝叶斯优化的效果,并初步探索变量空间,研究在优化开始前,单独进行了一次设计实验(Design of Experiments, DOE)分析。使用LHS生成了32个样本点(覆盖五个变量),并对每个点进行了CFD模拟。这组数据用于分析各变量对目标函数影响的分布情况,并作为后续贝叶斯优化性能对比的基准。
第四部分:主要研究结果与分析
1. 实验设计分析结果 对32个DOE样本的CFD模拟结果显示,细胞质量生长率M(X)分布在0.458至0.509 g/s之间,大部分结果集中在0.47-0.48 g/s的中段。这表明设计参数和操作条件的改变确实对反应器性能有显著影响。尽管从DOE样本中找出了性能较好的案例(如LHS-19, M(X)=0.509 g/s),但通过对这些“优等生”样本的气含率分布图分析发现,即使在较好的情况下,反应器内仍存在明显的氧气限制区域,主要位于分布器下方以及搅拌桨之间的交界处。这暗示通过系统的优化方法,性能仍有提升空间。
2. 贝叶斯优化结果与深入分析 应用贝叶斯优化后,仅用少量迭代,最优解的性能便超越了DOE的最佳结果。最终获得的最优解(样本A)其M(X)达到0.517 g/s。最优解的变量组合具有鲜明特征:宽挡板(B接近上界)、窄搅拌桨间距(S接近下界)、低通气速率(Q接近下界但非最低)、高搅拌转速(N接近上界)。 为了深入理解这一最优解为何有效,研究将其与几个对比样本进行了细致的CFD结果可视化比较: * 与最差样本(B)对比:最差样本采用低搅拌转速和不同的设计。流线图显示,氧气主要因浮力上浮,未能被搅拌桨有效打散并输送到反应器底部,形成大片“气体死区”。细胞生长速率分布图证实,在搅拌桨附近和反应器底部几乎没有细胞生长。这说明搅拌转速是影响气体全局分散的关键操作变量。 * 与相似操作条件但不同设计的样本(C)对比:样本C具有与最优样本A相似的通气速率和搅拌转速,但挡板较窄、搅拌桨间距较大。结果显示,其细胞生长速率和气体分布与样本A相似,但在反应器底部区域出现了更多的气体供应不足。这表明,即使操作条件优越,不良的设计(如挡板宽度不足、桨间距过大)仍会阻碍气体向特定区域(如分布器下方)的有效输送,从而形成局部死区,限制整体性能。 * 与通气速率更低的样本(D)对比:样本D的搅拌转速与样本A相近,但通气速率取了下界(0)。其性能(0.511 g/s)略低于样本A(0.517 g/s)。这一对比揭示了一个重要发现:并非通气速率越低越好。过低的通气速率虽然可能有利于形成更均匀的分散,但也可能导致整体供氧不足,从而限制细胞生长。 最优解中的通气速率是一个平衡值,体现了各变量间复杂的相互作用。
3. 关键洞察 通过整合流场、气含率和细胞生长率的可视化分析,本研究得出了超越传统认知的结论:以往许多研究将优化重点放在最大化气体滞留率(Gas Holdup) 上,但本研究证明,减少“气体死区” 比单纯提高整体气含率更重要。最优设计(宽挡板、窄桨间距)促进了气体克服浮力向下游区域(尤其是分布器下方)的输送,而最优操作条件(高转速、适度低通气)则确保了气体能在整个反应器内均匀分散,同时避免局部过载或整体不足。
第五部分:结论与价值
本研究成功开发并演示了一个集成了详细发酵动力学模型与多相CFD模拟的优化框架,并利用高效的贝叶斯优化算法,系统地解决了发酵反应器设计与操作条件优化的难题。研究得出结论:通过同时考虑发酵动力学和流体动力学,并采用宽挡板、窄搅拌桨间距、适度低的通气速率和高的搅拌转速这一组合,可以显著提升发酵反应器性能。其核心机制在于改善了气体分布,并最小化了停滞区域。
本研究的科学价值在于:提供了一个将“昂贵”的CFD模拟与高效全局优化算法相结合的方法论典范,为处理其他类似的复杂化工过程优化问题提供了可行路径。其应用价值则在于:为工业发酵过程的放大与优化提供了基于机理的、定量化的设计指南,挑战了仅关注气含率的传统观点,强调了从“气体供应”到“细胞生长”的全链条综合评估的重要性,有助于实现更精确、更可放大的发酵过程。
第六部分:研究亮点
第七部分:其他有价值内容
研究还进行了一些有价值的补充分析。例如,考虑到发酵过程中细胞浓度增加可能导致培养基粘度变化,研究者根据文献公式估算了粘度可能的变化范围(约增加3.65%),并进行了补充CFD模拟。结果表明,这种程度的粘度变化对流体流动和细胞生长速率的影响可以忽略不计,从而支持了研究主体采用恒定粘度进行模拟的合理性。此外,研究详细讨论了CFD模拟中处理稳态与动力学耦合的策略(拟稳态方法),以及如何处理氧气限制区域的判定问题,这些技术细节对于相关领域的研究者复现或借鉴该方法具有参考价值。