学术报告:《Recent advances on protein engineering for improved stability》论文评介
作者与发表信息 本文由来自山西大学化学化工学院的史靖浩、杨恒权,以及中国科学院天津工业生物技术研究所的袁博、孙周通共同撰写。其中,袁博、杨恒权和孙周通为通讯作者。该文作为一篇综述文章,发表于2025年的《Biodesign Research》期刊第7卷,文章标识符为100005。
论文主题与背景 本文是一篇聚焦于蛋白质工程领域,特别是以提高酶稳定性(包括热稳定性和有机溶剂稳定性)为核心目标的综合性综述。文章系统性地回顾和总结了近年来在该领域取得的重要进展,重点探讨了三种前沿或广泛应用的策略:基于B因子的理性设计、祖先序列重建以及机器学习辅助的酶工程。
在工业生物催化领域,酶的稳定性是其能否大规模应用的关键瓶颈之一。理想的工业过程往往需要在高温或有机溶剂环境中进行,前者可以提高反应速率,后者有助于改善疏水性底物的溶解度。然而,天然酶通常在严苛条件下容易失活。因此,通过蛋白质工程手段改造酶,使其耐受高温和有机溶剂,是生物制造领域长期以来的核心目标。传统的酶工程方法,如引入二硫键、盐桥、氢键网络等,虽然有效,但往往依赖于经验和试错。随着结构生物学、计算生物学和人工智能技术的发展,更为精准和高效的酶设计策略不断涌现。本文旨在梳理这些现代方法,为研究者提供一个清晰的技术路线图,并展望未来发展趋势。
主要论点与论据阐述
1. 基于B因子分析指导的酶稳定性工程 B因子(B-factor),也称为德拜-瓦勒因子或温度因子,是X射线晶体学中描述蛋白质原子热运动程度的关键参数。文章指出,B因子已成为识别蛋白质柔性(通常与不稳定性相关)区域的有力工具。高B因子的区域往往是结构柔性强、稳定性差的位点,针对这些位点进行定点突变(如引入刚性的脯氨酸或通过计算设计稳定突变)是提高热稳定性的有效策略。
文章详细阐述了B因子应用的多个层面和案例: * 识别不稳定区域与指导突变:例如,Cabanding等人通过分析脂肪酶(PAL)的B因子,设计了破坏α-螺旋的脯氨酸突变,其中R119P突变体活性提高了近9倍,B因子分析揭示该突变导致酶“开放”构象的 gorge(峡谷)半径变宽、灵活性增加,从而提升了催化效率。 * 结合计算工具进行虚拟筛选:针对B因子识别出的柔性位点进行全饱和突变实验成本高昂。Ru等人将B因子分析与Rosetta软件结合,先对高B因子位点进行虚拟饱和突变,计算每个可能突变的自由能变化(ΔΔG),仅挑选ΔΔG负值最大(即预测最稳定)的少数突变体进行实验验证。他们成功获得了多个热稳定性显著提升的突变体,如N102P/D500G双突变使最适温度提高了5°C。 * 应用于多亚基酶界面工程:对于多聚体酶,亚基界面的稳定性至关重要。Xue等人结合B因子分析和界面自由能计算(ΔΔG),靶向酮戊酸羟甲基转移酶(KPHMT)的二聚体界面进行设计,获得了半衰期延长近一倍的优化突变体。 * 局限性:文章也客观指出了B因子方法的局限性,例如在晶体结构分辨率较低时可靠性下降,且B因子本身仅指示柔性,并不能直接给出具体的突变方案,仍需与其他方法(如计算设计、饱和突变)结合。
2. 利用祖先序列重建发掘高稳定性酶 祖先序列重建(Ancestral Sequence Reconstruction, ASR)是一种基于现有同源蛋白序列,通过计算推断已灭绝祖先蛋白序列的方法。文章强调,大量研究表明,重建出的祖先酶往往展现出比现代同源酶更高的热稳定性和更宽的底物谱,这被认为是远古地球高温环境的适应性遗迹。因此,ASR成为获取高稳定性酶模板或挖掘新型酶的有力工具。
文章通过多个实例说明了ASR的应用价值: * 直接获取稳定酶:Lewis等人使用FireProtASR平台重建了113个烯还原酶(EREDs)的祖先和同源序列,发现祖先酶的平均热稳定性比现代酶高出约9°C。Ni等人通过ASR重建了醇脱氢酶(KpADH)的祖先序列,获得的A64酶在热稳定性和底物谱范围上均优于现代酶。 * 作为定向进化的优良起点:祖先酶因其更高的稳定性和结构可塑性,被认为是更好的定向进化出发模板。Gomez-Fernandez等人重建的祖先漆酶(LacAnc100)不仅自身稳定性更好,以其为模板进行定向进化,成功获得了对特定底物氧化速率提高160%的突变体。 * 与深度学习结合:Li等人将ASR与深度学习模型ProteinMPNN结合,用于设计UDP-葡萄糖焦磷酸化酶(UGP)。他们利用ASR获得祖先节点序列,结合现代序列进行比对,筛选出潜在有益突变,最终获得了在60°C下半衰期延长500倍、且保留90%活性的三重突变体。这展示了ASR与现代计算工具融合的强大潜力。 * 挑战与前景:文章也指出ASR的挑战,包括重建序列的不确定性、稳定性提升可能伴随活性或选择性下降的权衡,以及早期对计算专业知识的要求较高。但作者认为,随着FireProtASR、FastML等一体化自动化平台的出现,以及基因合成成本的下降,ASR的应用门槛正在降低,前景广阔。
3. 机器学习驱动的蛋白质稳定性设计与优化 随着计算能力、蛋白质数据库和测序技术的进步,机器学习(ML)正在成为酶工程领域变革性的工具。文章指出,ML能够从海量的序列、结构和实验数据中学习复杂模式,从而预测突变对酶性质(如稳定性、活性)的影响,指导理性设计。
文章从多个角度阐述了ML的应用: * 应对数据稀缺与组合爆炸问题:在多点组合突变设计中,可能的突变组合数量巨大,实验筛选难以覆盖。Zhang等人针对果胶裂解酶(PNL),在有限的实验数据样本(106个突变体,含88个组合突变)基础上,构建ML模型来预测多点组合突变体的热稳定性。他们采用10折交叉验证和SHAP等算法优化模型,成功预测出半衰期提升60倍以上的最优组合突变体,展示了ML在小数据集中指导高效探索序列空间的潜力。 * 指导定向进化进程:Wu等人将ML模型整合到硝酸盐双加氧酶(NOD)的定向进化循环中。每一轮进化后,用新获得的实验数据更新模型,预测下一轮最有潜力的突变。这种方法比传统随机进化能更高效地探索序列空间,快速获得了对映选择性显著提升的变体。 * 深度学习与结构微环境分析:深度学习是ML的重要分支。Lu等人利用名为MutCompute的自监督卷积神经网络(CNN),分析蛋白质数据库中超过19,000个蛋白的局部化学微环境,来识别稳定突变。他们将此方法应用于PET水解酶(FAST-PETase)的工程化,获得了稳定性和降解性能显著提升的变体。 * 数据与挑战:文章强调,ML的成功高度依赖于高质量、大规模的数据集。目前,尽管有PDB、UniProt等大型数据库,但针对特定酶性质(如突变后的热稳定性变化)的标准化、大规模实验数据集仍相对匮乏,这限制了ML模型的普适性和精度。此外,缺乏导致性能下降的“负面”突变数据,也影响了模型预测有害突变的能力。未来,积累更多高质量实验数据是推动ML在酶工程中更广泛应用的关键。
4. 提高有机溶剂耐受性的蛋白质工程策略 除了热稳定性,文章还专门探讨了提高酶在有机溶剂中耐受性的工程策略。有机溶剂可能通过引起蛋白质构象变化、剥夺必需水分子或竞争性抑制等方式导致酶失活。
文章总结了该方向的几种思路: * 热稳定性与溶剂稳定性的关联:研究表明,通过提高热稳定性获得的突变体,往往也表现出更好的有机溶剂耐受性,如Reetz等人对枯草芽孢杆菌脂肪酶(BSL)的研究。 * 表面与界面工程:针对有机溶剂环境,对酶表面进行改造是有效策略。Cui等人通过将枯草芽孢杆菌脂肪酶A(BSLA)表面暴露的氨基酸替换为极性残基,增强了其在DMSO中的稳定性。分子动力学模拟表明,有益突变减少了酶表面DMSO分子的局部数量,增加了水分子,降低了局部柔性。 * 新表征参数:Sorgenfrei等人引入了新的参数“Ct U50”(50%蛋白质未折叠时的共溶剂浓度),用于更准确地表征酶在不同溶剂浓度下的稳定性与活性的平衡,为评估酶在有机溶剂中的性能提供了新视角。 * “角落工程”新策略:Wang等人提出了一种名为“角落工程”的新方法,靶向蛋白质二级结构元件(如α-螺旋和β-折叠)之间的过渡区域(如ω-环)。他们在BSLA的25个“角落”位点引入带电氨基酸,构建小型化文库进行筛选,成功获得了在深共晶溶剂中催化效率提升高达10倍的变体,并将此策略成功应用于其他酶(酯酶、纤维素酶),展示了其普适性潜力。
论文的意义与价值 本综述文章具有重要的学术价值和指导意义: 1. 系统性梳理:文章并非简单罗列文献,而是将近年来蛋白质稳定性工程领域的主流和前沿技术(B因子、ASR、ML)进行了系统性的归纳、比较和串联,清晰地勾勒出该领域从传统经验设计到现代计算理性设计的发展脉络和技术融合趋势。 2. 深度案例分析:对于每一种策略,文章都提供了具体、前沿的研究实例,详细说明了方法的应用流程、取得的成效以及潜在的局限性,使读者不仅能了解概念,更能掌握其应用细节和关键考量。 3. 突出交叉融合:文章的核心亮点在于强调了不同策略之间的交叉与协同。例如,B因子分析与Rosetta等计算工具的结合,ASR与深度学习的融合,ML在传统定向进化中的引导作用等。这指明了未来酶工程研究的重要方向:综合利用多种计算和实验手段,进行多维度、智能化的酶设计。 4. 展望未来挑战:文章在介绍进展的同时,也客观指出了各技术面临的挑战,如B因子对晶体质量的依赖、ASR的不确定性、ML的数据需求等。这种辩证的视角有助于研究者理性选择技术路线,并认清未来需要突破的瓶颈。 5. 实践指导性强:对于从事酶工程、工业生物催化、蛋白质设计等领域的研究人员和工程师而言,本文是一份极具参考价值的“技术地图”和“工具箱指南”,能够帮助他们快速了解领域动态,选择合适的技术方案来解决酶稳定性这一核心工业问题。
这篇综述成功地将蛋白质稳定性工程领域分散的研究进展整合成一个逻辑清晰、内容详实的技术体系,不仅总结了现状,更通过展示不同方法的交叉应用案例,预示了该领域向着更智能化、集成化方向发展的未来趋势。