动态分区模型：一种用于补料分批发酵的快速建模方法

分享自：
动态分区模型：一种用于补料分批发酵的快速建模方法

期刊:Chemical Engineering ScienceDOI:10.4121/0a08d2ec-8959-403f-afea-2b085dc9f3a6
关于“动态分区模型：一种用于流加发酵的快速建模方法”的学术研究报告
一、 研究团队与发表信息
本研究报告基于2025年发表于《化学工程科学》（*Chemical Engineering Science*）期刊第308卷上的一篇原创性研究论文。该论文题为“动态分区模型：一种用于流加发酵的快速建模方法”（Dynamic compartment models: towards a rapid modeling approach for fed-batch fermentations）。主要作者为 Héctor Maldonado de León， Adrie J.J. Straathof 和 Cees Haringa，均来自荷兰代尔夫特理工大学（Delft University of Technology）生物技术系。
二、 学术背景与研究目标
本研究属于生物过程工程与计算流体力学交叉领域，核心关注生物反应器（尤其是发酵罐）的放大过程建模与优化问题。
科学背景： 在生物技术产业化过程中，将实验室规模的发酵工艺放大到工业规模（如从几升到上百立方米）是一项巨大挑战，常被称为“死亡之谷”。放大过程中，由于混合、传质等流体力学行为的改变，反应器内会出现浓度梯度（如底物、溶氧、pH不均一），这些异质性环境会显著影响微生物的生理和代谢，导致生产效率下降或产物质量不稳定。传统上，计算流体力学（Computational Fluid Dynamics， CFD）是深入分析反应器内流场和浓度分布的有力工具。然而，CFD模拟计算成本极高、耗时极长，通常只能针对少数几个稳态工况进行分析，难以用于需要反复迭代、探索大量操作条件的动态过程（如流加发酵）优化和设计空间探索。
研究目标： 针对上述瓶颈，本研究旨在开发一种新型的、计算高效的动态分区模型（Dynamic Compartment Model, Dyn-CM）方法。该方法旨在快速、且以可接受的精度，预测在流加发酵过程中，随着液位和搅拌速度变化时，反应器内部的时空动态变化（如混合、底物浓度梯度）。其终极目标是提供一个实用工具，能够在有限的算力资源下，支持反应器设计、操作条件优化以及放大效应分析，从而降低工艺开发成本和风险。
三、 详细研究流程与方法
本研究工作流程系统且复杂，主要包含以下几个关键步骤：
1. 建立基准“真实”数据：CFD稳态流场模拟 首先，研究团队选择了一个133立方米的大型搅拌罐反应器作为研究对象，其配备单层Rushton涡轮和4块挡板。他们使用商业CFD软件（ANSYS Fluent™）对反应器在不同操作条件下进行了高精度的单相流稳态模拟，以获取“冻结流场”。这些操作条件覆盖了流加发酵过程中可能出现的液位范围（63.5 至 133 m³）和搅拌速度范围（0.25 至 1.46 s⁻¹）。模拟采用了标准k-ε湍流模型和多重参考系（Multiple Reference Frame， MRF）方法，网格单元数约200万。这些CFD模拟结果被视为后续所有模型构建与验证的“地面真实”基准数据。
2. 构建基于CFD的分区模型（CFD-CM） 分区模型（Compartment Model， CM）的核心思想是将复杂的反应器空间离散化为一系列相互连接的、内部完全混合的理想子区域（即分区）。本研究采用了一种基于CFD流场数据自动生成分区模型参数的方法。具体流程如下： * 分区布局定义： 研究采用固定的轴对称二维分区网格。径向固定为5个分区，轴向分区的数量则根据液位高度（以15厘米为固定分区高度）动态确定。这种布局（标记为A[Na]R[5]）旨在捕捉Rushton涡轮产生的径向射流和上下循环流的主要特征。 * 数据提取与参数化： 从CFD模拟结果中，提取一个旋转45度的二维平面上的节点数据，包括速度分量、坐标和湍流动能。基于这些数据，计算相邻分区之间的交换流量（Φ(i,j)）。交换流量由对流项和湍流项两部分组成（公式1）。对流项通过计算分区界面处的平均速度与界面面积的乘积得到（公式2）；湍流项则通过界面处的湍流动能估算（公式3）。由于数据采样可能引入误差导致质量不守恒，研究采用了一个基于最小二乘法的流量调和（reconciliation）优化程序（公式4）来强制满足每个分区的质量守恒。 * 模型验证（混合时间）： 为了验证CFD-CM的准确性，研究团队比较了CFD-CM与完全耦合的CFD瞬态混合模拟所预测的95%混合时间（Ntm,95%）。在CFD-CM中，混合模拟通过求解分区网络中的对流-扩散方程来完成，追踪示踪剂浓度随时间在分区中的变化。
3. 开发动态分区模型（Dyn-CM）：集成机器学习 CFD-CM虽然比全尺度CFD快，但其参数（交换流量）依赖于特定操作条件（液位HL、搅拌速度Ns）下的CFD模拟。一旦操作条件改变（如流加过程中液位上升），就需要重新运行昂贵的CFD来重新校准CM，这限制了其在动态优化中的应用。 为解决此问题，本研究引入了机器学习模块来构建动态分区模型（Dyn-CM）： * 核心思想： 利用步骤1和2中生成的不同（HL， Ns）条件下的CFD-CM参数化数据集，训练一个前馈神经网络（Feed-Forward Neural Network）。该神经网络以空间位置（轴向和径向坐标）、液位和搅拌速度作为输入，直接预测出该操作条件下，固定分区布局中所有分区间的径向和轴向交换流量（公式5）。 * 网络架构与训练： 经过超参数优化后，最终网络包含13个隐藏层，每层100个神经元，使用ReLU激活函数。损失函数为预测交换流量与CFD-CM基准值之间的均方根误差（公式6）。训练数据涵盖了从63.5到123 m³液位、0.25到1.46 s⁻¹搅拌速度范围内的多个CFD-CM实例。 * 功能： 训练好的神经网络成为一个“推断模块”。对于任意给定的（HL， Ns）组合（即使未出现在训练集中，但需在训练空间内），无需运行新的CFD，即可快速生成对应的分区模型参数，从而实现反应器流体力学特性的动态、快速预测。
4. 集成生物动力学与动态过程模拟 为展示Dyn-CM在真实发酵过程分析中的应用潜力，研究将其与一个假设的“黑箱”微生物动力学模型耦合，模拟了一个长达43小时的流加发酵过程。 * 动力学模型： 该模型包含底物比消耗速率（采用Monod方程）、基于Herbert-Pirt关系的生长、产物合成与维持代谢，并特别引入了高底物浓度对产物合成的抑制效应（公式7-9）。模型参数（如最大比消耗速率qs,max、饱和常数Ks、抑制常数Ks,I等）经过设计，使其对底物梯度敏感（表1）。 * 动态模拟流程： 在模拟过程中，随着底物流加，反应器内液位逐渐升高。Dyn-CM模块根据当前时刻的液位和固定的搅拌速度，动态更新分区模型的体积和交换流量。然后，在每个时间步长内，求解包含对流、扩散和反应项的分区质量平衡方程，从而获得底物、生物量和产物浓度在反应器内随时间和空间的分布。 * 对比基准： 同时运行一个理想混合模型（假设反应器内完全均一）作为对比，以凸显空间异质性的影响。
四、 主要研究结果
1. CFD-CM的验证结果 CFD-CM预测的混合时间与全尺度CFD模拟结果相比，大部分落在±30%的误差范围内（图5）。这表明，尽管分区模型大幅简化了空间分辨率（从百万网格到数十个分区），但仍能合理捕捉决定过程性能的关键混合现象。计算效率提升显著：对于一个98.2 m³的反应器，CFD-CM完成一次混合时间分析所需时间仅为全CFD模拟的约1/720（CPU对比）或1/4（GPU加速CFD对比）（图6）。然而，对比混合曲线和浓度云图（图7， 8）发现，CFD-CM倾向于预测更快的局部混合，但整体混合时间趋势与CFD一致。这种差异源于模型简化（如轴对称假设、分区内理想混合）导致的对某些流动细节的平滑。
2. Dyn-CM（机器学习模块）的性能评估 * 对训练点的预测： Dyn-CM对训练数据集中操作条件预测的混合时间，与直接从CFD数据参数化的CM结果吻合良好，并且也基本保持在相对于CFD基准的±30%误差带内（图9）。这表明神经网络成功学习了从操作条件到流场参数（交换流量）的复杂映射关系。 * 对未见过操作点的预测（测试）： 对于训练空间内的新操作点（中间液位），Dyn-CM的混合时间预测也基本在可接受的误差范围内（图10）。然而，对于训练空间外的极端操作点（如极高或极低液位），预测误差显著增大（超过±30%），这凸显了机器学习模型外推能力的局限性。误差分析图（附录B.2）显示，预测误差主要出现在高流速区（如叶轮射流区）和近壁停滞区，这些区域的流动特性复杂，神经网络难以精确捕捉。
3. 动态流加发酵过程模拟结果 * 过程曲线： 耦合了动力学模型的Dyn-CM成功模拟了43小时的流加发酵过程，其计算时间仅为实际发酵时间的1/500（约4.38分钟），实现了对时空动态的高效求解。模拟结果显示（图11），动态CM预测的体积平均底物、生物量和产物浓度曲线与理想混合模型的趋势总体一致，但存在明显偏差。大约5小时后，两种模型的预测开始分化。 * 梯度分析与影响： 这种偏差源于反应器内形成的底物浓度梯度。动态CM能够揭示这些梯度（图12）：在底物流加点附近浓度较高，而在远离加料点的区域（如叶轮下方）浓度较低。由于动力学模型中包含高底物对产物合成的抑制，梯度导致局部产物合成速率下降，更多的底物被用于生长。计算第一达姆科勒数（DaI， 表征反应与循环时间尺度之比）发现，发酵约10.5小时后，DaI > 1，证实了显著梯度存在的必然性。到发酵结束时，动态CM预测的总产物量比理想混合模型低了约30.3%（71.5 mol）。这定量展示了忽略空间异质性可能严重高估过程性能。 * 与CFD的对比： 动态CM预测的底物消耗梯度（qs/qs,max）的空间分布模式与CFD模拟结果定性一致，能够捕捉到主要结构特征（如加料点附近的高消耗区）。但在定量上存在差异，这归因于分区模型本身的分辨率限制以及ML模块引入的误差。
五、 研究结论与价值
本研究成功开发并验证了一种结合CFD、分区模型和机器学习的新型动态建模工作流程（Dyn-CM）。该工作流程能够以极低的计算成本（相对于全尺度CFD），快速预测搅拌罐反应器在液位和搅拌速度变化时的流场特性，并将其与微生物动力学耦合，实现对流加发酵过程时空异质性的高效模拟。
科学价值： 本研究提出了一种创新的“降阶模型”构建范式。它通过机器学习将高保真的CFD数据“压缩”成一个轻量级的动态代理模型（surrogate model），在保持关键物理现象（混合、梯度）预测能力的同时，实现了计算效率的飞跃。这为处理具有动态边界和操作条件的复杂多物理场系统建模提供了新思路。
应用价值： 该方法为生物过程工程师提供了一个强大的工具。它使得在个人计算机或小型计算集群上，对工业规模的发酵过程进行“虚拟实验”和设计空间探索成为可能。工程师可以快速评估不同加料策略、搅拌方案、反应器几何尺寸对过程性能（尤其是可能受梯度影响的产量、得率）的影响，从而在昂贵的实际中试或放大实验之前，优化工艺设计和操作条件，降低放大风险。
六、 研究亮点
方法创新性： 核心创新在于将机器学习（神经网络）作为桥梁，实现了分区模型参数（交换流量）对动态操作条件（液位、转速）的连续、快速预测，从而首次构建了真正意义上的、可用于全流程动态模拟的“动态分区模型”，解决了传统CM需要频繁CFD重校准的痛点。
计算高效性： 所开发的Dyn-CM在保持合理精度的前提下，将模拟时间缩短了数个数量级（文中举例为实际发酵时间的1/500），使其适用于需要大量模拟案例的优化和筛选研究。
系统集成性： 研究展示了从CFD基准数据生成、到CM参数化、ML模型训练、再到与生物动力学耦合进行动态过程模拟的完整、可复现的工作流程，并提供了详细的验证和误差分析。
问题导向明确： 研究紧密围绕生物过程放大中的实际工程难题（流加发酵的动态异质性），所开发的工具具有明确的工业应用前景。
七、 其他有价值内容与展望
论文在讨论部分也坦诚指出了当前方法的局限性并展望了未来发展方向： * 几何与操作局限性： 当前模型仅针对单层Rushton涡轮、单相（无通气）系统。未来需要扩展到多相流（通气发酵）、多搅拌器、不同搅拌桨类型、内置冷却盘管等更复杂的几何与操作条件。 * 模型通用性： 当前模型是针对特定反应器几何训练的。要构建一个适用于多种反应器类型的通用模型，需要更大的CFD数据库，并处理几何参数作为分类或连续变量输入。 * 精度提升途径： 可通过采用更先进的分区策略（如3D分区、基于流场特征的自动分区）、集成更复杂的机器学习架构（如物理信息神经网络PINNs、Transformer），或改进损失函数（结合数据驱动和物理约束）来进一步提升预测精度和物理一致性。 * 扩展应用： 该工作流程的基本原理可进一步扩展，用于结合群体平衡模型或随机粒子模型来研究细胞历史效应，从而更全面地模拟规模放大对细胞生理的影响。
这项研究为加速生物过程开发和放大提供了一种极具潜力的计算工具，是计算流体力学、机器学习与生物过程工程深度融合的一个成功范例。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问