这项研究由来自多所知名研究机构的科研团队共同完成。主要作者包括宾夕法尼亚州立大学化学工程系的Mengqi Hu、Hoang V. Dinh、Patrick F. Suthers、Charles J. Foster和Costas D. Maranas*,普林斯顿大学及刘易斯-西格勒综合基因组学研究所的Yihui Shen、Catherine M. Call、Joshua D. Rabinowitz和Jimmy Pratas,普林斯顿大学分子生物学系的Xuanjia Ye,以及伊利诺伊大学厄巴纳-香槟分校Carl R. Woese基因组生物学研究所的Zia Fatma和Huimin Zhao。该研究发表于国际期刊Metabolic Engineering 第76卷,于2023年1月在线发表。
本研究属于代谢工程和系统生物学领域,具体关注基因组规模动力学模型的构建与应用。其学术背景源于当前的代谢工程实践:以约束为基础的基因组规模代谢模型虽然成功应用于菌株设计,但无法直接考虑酶水平、动力学限制、代谢物浓度依赖性和底物水平调节等关键因素。相比之下,动力学模型提供了一个机制性框架,能够整合多组学数据并预测扰动下的代谢变化。然而,为特定菌株构建大型动力学模型面临参数稀缺、计算负担高以及数据不足等挑战。一个悬而未决的核心问题是,针对同一物种不同菌株构建的动力学模型,其参数是相似的还是存在显著差异?这决定了动力学模型的可应用范围和预测极限。因此,本研究旨在通过参数化两个不同酿酒酵母(Saccharomyces cerevisiae)菌株(CEN.PK 113-7D 和 BY4741)的基因组规模动力学模型,比较其差异,评估模型在不同菌株间的可互换性(即互操作性),从而探究动力学模型捕捉物种特异性信息的能力及其在代谢工程中的应用潜力。
该研究的详细工作流程主要包含以下几个核心步骤: 1. 模型网络构建与简化:研究基于已发布的酵母基因组规模代谢模型iSace1144(源自Yeast 8模型),构建了一个大型代谢网络。初始网络包含486个反应和386个代谢物。在好氧、葡萄糖条件下,通过通量可变性分析和守恒分析,移除了无通量反应和线性依赖,并将冗长生化途径(如脂肪酸和麦角固醇合成途径)简化为其前体。最终得到了一个包含306个反应、230个代谢物的核心网络,并纳入了从BRENDA数据库中提取的119个底物水平调节相互作用。该网络被用于两个菌株的动力学建模,确保了模型结构的一致性。 2. 实验数据收集与通量分析:研究分别收集了两个菌株的13C-代谢通量分析数据用于模型参数化。 - CEN.PK菌株数据:从文献(Blank等人,2005年)中获取了野生型和8个单基因敲除突变株(ald6δ, fum1δ, lsc1δ, mae1δ, mdh1δ, mdh2δ, oac1δ, pda1δ, rpe1δ, zwf1δ)的13C-通量数据。其中,对某些通量极低的基因敲除数据进行了筛选,以避免参数估计偏差。 - BY4741菌株数据:研究团队自行生成了BY4741野生型及其7个单基因敲除突变株的13C-通量数据。实验包括在含标记葡萄糖的培养基中培养酵母,使用液相色谱-质谱联用技术分析代谢物的同位素标记分布,并结合生长速率和胞外代谢物通量测量,利用稳态通量分析软件进行通量计算,获得高分辨率的通量分布。 3. 动力学模型参数化:采用K-Fit算法(一种基于梯度的分解参数化工具)分别对两个菌株的网络进行动力学参数化。输入包括反应化学计量矩阵、调节机制(底物抑制)、以及野生型和各突变株的通量数据集。K-Fit通过迭代求解分解的基元步骤方程,估算出能最小化所有预测通量与实验通量之间残差平方和的基元动力学参数及相对代谢物浓度。研究为每个菌株进行了1500次随机初始化的多起点计算,以确保找到最优或近优的参数集。 4. 模型评估与分析:计算并比较了两个菌株最优参数化模型的性能。评估了模型对训练数据集中通量的复现能力(通过R²和残差平方和衡量)。使用King-Altman方法从基元参数推导出米氏参数(如Km, kcat, Ki)。通过对这些参数进行种内(同一菌株不同解)、种内不同菌株(CEN.PK vs BY4741)以及种间(酵母 vs 已有的大肠杆菌模型K-ecoli307)的成对比较,评估了参数的相似性。通过参数“互换”实验(即将一个菌株的动力学参数代入另一个菌株的模型,计算其预测误差)测试了模型的“互操作性”。 5. 预测能力验证:使用构建好的动力学模型,对文献中报道的其他工程菌株(涉及乙醇、6-甲基水杨酸等产物)的代谢物产率进行预测,并将预测结果与实验数据进行比较,以评估模型的外推预测能力。
研究得出的主要结果如下: 1. 菌株间代谢通量差异:13C-MFA数据揭示了两菌株显著的生理差异。CEN.PK野生型具有更高的比生长速率、更高的TCA循环通量(特别是丙酮酸脱氢酶和柠檬酸合酶活性更强)以及更高的生物质得率,表明其更偏向呼吸代谢。而BY4741野生型表现出更高的葡萄糖摄取率和乙醇产率,其TCA循环通量较低,主要依赖发酵途径产生ATP,显示出更强的Crabtree效应。这些表型差异为后续动力学参数的差异提供了生理背景。 2. 模型参数化成功:成功构建并参数化了两个大型动力学模型K-sacce306-cenpk和K-sacce306-by4741。两个模型均能很好地复现其各自训练数据集中的通量,R²值分别为0.98和0.99。约77%(CEN.PK)和75%(BY4741)的预测通量值落在实验通量值的一个标准差范围内。针对特定突变株的留一法交叉验证表明,模型对未参与训练的通量数据也具有一定预测能力,但移除某些关键数据集(如PPP途径突变体)会影响预测精度,这突显了训练数据集全面性的重要性。 3. 动力学参数的菌株特异性:通过比较两个菌株模型推导出的米氏参数,研究发现76%的Km和kcat值差异在一个数量级之内,这表明存在一定程度的保守性。然而,显著差异(超过一个数量级)的Km/Ki值主要集中在TCA循环(如异柠檬酸脱氢酶、α-酮戊二酸脱氢酶)、糖酵解/糖异生以及精氨酸和脯氨酸代谢途径的酶中。这表明这些途径的酶动力学特性是驱动两菌株代谢差异的关键。种内比较的相关系数显著低于同一菌株不同最优解之间的比较,而种间比较则几乎无相关性。这有力地说明,虽然模型结构相同,但动力学参数的数值具有高度的菌株特异性,编码了菌株特定的酶能力和调节信息。 4. 互操作性有限:参数互换实验表明,将BY4741的动力学参数直接用于预测CEN.PK的通量数据(反之亦然)会导致残差平方和急剧增加,预测准确性显著下降。这直接证明了动力学模型不能像化学计量模型那样在不同菌株间直接通用。不过,一个菌株的参数化结果可以作为参数化另一相关菌株的良好起点。 5. 预测评估结果:在预测其他工程菌株的产物产率时,基于CEN.PK背景构建的模型对CEN.PK相关工程菌的乙醇产率预测更准确。而K-sacce306-by4741模型在模拟某些酶水平扰动时,由于其对ATP抑制高度敏感的磷酸果糖激酶参数,导致模型难以达到稳定状态,这间接揭示了菌株间调节网络的潜在差异。对于异源途径产物的产率预测存在偏差,主要原因是网络中没有包含这些特定的分泌反应,且模型未能捕捉异源酶的动力学特性。
研究的结论是:虽然针对特定菌株构建的基因组规模动力学模型在参数上具有高度的菌株特异性,无法直接在不同菌株间互换使用,但它们能够通过参数化过程有效捕捉物种(乃至菌株)特有的代谢信息。这些信息是化学计量模型所无法提供的。研究明确了TCA循环、糖酵解等关键途径中的酶动力学差异是区分CEN.PK和BY4741菌株表型的主要驱动力。研究还证实,成功构建能准确预测表型的动力学模型需要一套覆盖中心代谢关键反应的全面扰动数据集(如基因敲除)。
该研究的科学价值在于首次对同一物种两个不同菌株进行了大规模的并行动力学模型构建与系统比较,为理解动力学模型的适用范围和局限性提供了实证依据。其应用价值在于为代谢工程师提供了重要见解:在应用动力学模型进行菌株设计和优化时,需要考虑模型的菌株背景匹配性,或针对目标菌株进行专门的参数化。研究提出的方法和框架也可推广至其他微生物物种,用于评估和比较不同菌株或在不同培养条件下的代谢调控网络。
本研究的亮点包括:1)研究问题新颖:直接挑战了动力学模型跨菌株应用的假设,探索了其互操作性的根本问题;2)数据全面:结合了文献数据和自行生成的高质量13C-MFA数据,为两个菌株提供了匹配的比较基础;3)方法系统:采用了统一的网络结构、相同的参数化算法,确保比较的公平性和结论的可靠性;4)分析深入:不仅比较了模型拟合效果,还深入到动力学参数层面进行定量比较,并通过参数互换和预测验证等多角度评估模型性能;5)结论明确且重要:明确指出动力学模型具有菌株特异性,这一结论对系统生物学和代谢工程领域具有重要的指导意义。