分享自:

非核糖体肽与聚酮化合物合成酶发现与工程的工具与策略

期刊:Natural Product ReportsDOI:10.1039/d5np00041f

迈向天然产物发现的统一管线:非核糖体肽合成酶与聚酮合酶途径探索与工程的工具与策略

作者与机构: 本文由 Biyan Chen, Emre F. Bülbül, Seounggun Bang, Hannah A. Minas 和 Kenan A. J. Bozhüyük* 共同撰写。作者单位包括德国萨尔布吕肯亥姆霍兹感染研究中心下属的亥姆霍兹药物研究所 (Helmholtz Institute for Pharmaceutical Research Saarland, HIPS) 以及瑞士巴塞尔的 Myria Biosciences AG 公司。本文作为综述文章发表于 《Natural Product Reports》 期刊,于2026年出版(卷43,页352-370),在线发表日期为2025年5月23日。

论文主题: 本文系统性地回顾了近年来在非核糖体肽合成酶(Non-ribosomal Peptide Synthetases, NRPS)和聚酮合酶(Polyketide Synthases, PKS)研究领域的关键进展。NRPS和PKS是自然界中负责合成大量结构复杂、药理活性强大的天然产物(如抗生素、免疫抑制剂、抗癌药物)的模块化巨型合成酶系统。本综述的核心论点是,一系列新兴工具和策略——涵盖基因组挖掘、高通量筛选、合成生物学以及计算建模(特别是结构建模和人工智能)——正在将这些系统从传统的“试错式”研究对象,转变为可理性设计与编程的生物合成平台。这些进展共同推动着天然产物发现与工程进入一个数据驱动、迭代优化的“设计-构建-测试-学习”(Design-Build-Test-Learn, DBTL)新范式。

主要观点阐述:

1. 基因组挖掘与异源表达策略的革新解锁了巨大的生物合成潜力。 天然产物发现的传统瓶颈在于“沉默”或“隐蔽”的生物合成基因簇(Biosynthetic Gene Clusters, BGCs)难以被激活和表征。本部分指出,高通量测序技术与日益强大的生物信息学工具(如 antiSMASH、PRISM、DeepBGC 等)相结合,已能系统性地从微生物基因组和宏基因组数据中预测海量的NRPS/PKS基因簇。然而,从基因序列到功能化合物的转化仍需实验验证。为此,综述重点介绍了两种互补策略:一是异源表达技术的进步,包括使用大容量载体(如BACs、FACs)和创新的体内基因簇操控工具(如 aCTI-MOT,一种基于CRISPR-Cas9的基因簇原位动员与扩增技术),成功在易操作的宿主(如大肠杆菌、链霉菌、酵母)中激活了众多先前未知的天然产物途径。二是唤醒沉默基因簇的策略,包括全局宿主重编程、启动子/调控因子工程、环境因子诱导以及合成微生物群落共培养等。这些方法极大地扩展了可被实验触及的天然产物化学空间,为后续的高通量筛选和工程化提供了丰富的原材料。

2. 高通量平台与去重复技术实现了从化合物检测到功能剖析的规模化分析。 随着大量生物合成基因簇变得可及,如何高效地对其产物进行结构鉴定和生物活性筛选成为新的挑战。本部分阐述了高通量筛选(High-Throughput Screening, HTS)平台的集成化发展。例如,利用小分子库进行高通量诱导剂筛选(HITES)来激活沉默途径;结合微流控、质谱成像(如MALDI-MS、DESI-MS)和自动化机器人系统,实现了对数千个菌株或工程变体的快速代谢指纹图谱分析;以及将高效液相色谱(HPLC)与微晶电子衍射(MicroED)联用,加速了复杂粗提物中晶体化合物的结构解析。在功能筛选方面,纳升级液滴微流控等技术允许对数千种化合物进行并行的微生物互作表型分析。与此同时,数据驱动的去重复(Dereplication)技术对于避免已知化合物的重复发现至关重要。文章介绍了基于质谱的分子网络(如GNPS)、人工智能驱动的原位碎片化预测工具(如 Sirius/CSI:FingerID、MS2DeepScore)以及核磁共振扩散排序谱(DOSY)等方法,它们能够快速比对和注释化合物,优先筛选出具有新颖结构的候选分子,从而将研究资源集中于真正的创新发现。

3. 模块与结构域层面的重新编程正在将巨型合成酶工程推向现实。 NRPS/PKS的模块化架构长期以来激励着人们对其进行重新编程以生产新化合物,但受限于结构域兼容性、底物特异性等问题。本部分详细回顾了模块水平工程的最新突破。传统上认为NRPS中的缩合-腺苷化(C-A)双结构域是不可分割的功能单元,但新策略如“硫酯化结构域内的交换单元”(Exchange Unit within the Thiolation domain, XUT)打破了这一观念。XUT利用进化分析识别T结构域内的同源重组位点,实现了跨远缘物种的功能性嵌合NRPS构建,且产量和兼容性优于早期方法。类似地,在PKS中,对模块边界(如重新定义为AT-ACP-KS)的重新认识也促进了成功的模块交换。此外,合成相互作用基序(如SynZips合成拉链、SpyTag/SpyCatcher共价连接对、DNA模板化组装)使得巨型合成酶能够以分体形式表达并在体内组装,极大地增强了设计的灵活性。在结构域水平工程方面,通过理性设计或定向进化对负责底物选择的腺苷化(A)结构域或酰基转移酶(AT)结构域进行改造,可以改变其底物特异性,从而引入非天然氨基酸或聚酮前体,扩展产物的化学多样性。这些进展表明,对NRPS/PKS进行精确的“重新布线”正逐渐从概念走向实践。

4. 计算建模方法为理性设计与工程提供了强大的预测能力。 计算工具正深刻改变着NRPS/PKS系统的研究、设计和优化方式。本部分将计算策略分为两大类。首先是基于结构的方法,其典型工作流程包括:利用AlphaFold2等AI工具或同源建模获得酶或结构域的三维模型;通过分子对接研究底物结合或结构域间相互作用;运用分子动力学(Molecular Dynamics, MD)模拟揭示系统的构象动态和催化机制;最后通过结合自由能计算和残基能量分解定量评估突变的影响。这些方法能够深入理解底物识别、结构域通讯和催化效率的分子基础,从而指导理性的突变设计和路径优化。其次是人工智能驱动的蛋白质设计。AI不仅提升了BGC挖掘和注释的准确性(如DeepBGC、TouCAN等工具),还能预测底物特异性(如NRPSpredictor2、DeepAden等),甚至从头设计酶结构。尽管AI模型在通用性、动态行为预测和实验验证反馈方面仍面临挑战,但它们与基于结构的方法相结合,正在形成一个可扩展的、预测性的框架,加速了从基因组序列到功能酶设计的转化过程。

5. 迭代的“设计-构建-测试-学习”框架是整合多学科进展、实现可编程生物合成的关键。 全文贯穿的核心思想是,上述所有技术进步——从基因组挖掘、异源表达、高通量分析到模块工程和计算设计——并非孤立存在,而是被整合进一个迭代的“设计-构建-测试-学习”(DBTL)循环中。在这个框架下,“设计”阶段利用计算模型和序列分析指导酶或途径的选择与优化;“构建”阶段运用DNA合成、结构域交换和突变等技术组装工程化系统;“测试”阶段通过表型筛选、代谢物分析或功能测定来评估结果;“学习”阶段则整合实验结果(通常借助机器学习)来优化后续的设计迭代。这种数据驱动的、闭环的工程范式,正在将NRPS/PKS的探索从经验性尝试转变为一种更理性、可预测、可扩展的设计学科。

论文的意义与价值: 本综述的价值在于它系统性地梳理并整合了NRPS/PKS研究领域从前沿发现到理性工程的全链条最新进展。它不仅为领域内的研究人员提供了一份全面的“技术路线图”和工具指南,更重要的是,它清晰地描绘了该领域正在发生的范式转变:从依赖自然发现的被动筛选,转向主动的、基于计算预测和合成生物学原理的可编程生物合成。文章指出,未来突破的关键在于数据、工具与实验的深度融合:需要构建更完善的注释数据库、功能表征基准和已验证的设计规则库,以训练更精准的预测模型。最终,实现NRPS/PKS平台成为按需合成具有特定功能的“新天然”或“非天然”分子的强大引擎,将在药物研发、农业和工业生物技术等领域产生深远影响。本文由该领域的活跃研究者团队撰写,兼具权威性与前瞻性,对推动天然产物化学与合成生物学的交叉融合具有重要的指导意义。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com