分享自:

利用数据库衍生相对质谱质量亏损和分子网络发现新型天然产物骨架的系统方法

期刊:JACS AuDOI:10.1021/jacsau.4c00889

本研究由来自美国国立卫生研究院国家糖尿病、消化和肾脏疾病研究所(NIDDK)生物有机化学实验室的Hyo Moon Cho、Carole A. Bewley*等,以及来自意大利萨莱诺大学药学院的Eleonora Boccia、Giuseppe Bifulco等,和美国国立过敏与传染病研究所(NIAID)结核病研究科的Helena Boshoff、Clifton Barry, III等研究人员共同完成。研究成果以“A Systematic Approach to Discover New Natural Product Scaffolds Using Database-Derived Relative Mass Spectral Defects and Molecular Networking”为题,于2025年1月16日发表在《JACS Au》期刊上。

本研究属于天然产物化学与代谢组学交叉领域。天然产物是药物发现的重要来源,尤其是在抗生素和化疗药物开发中。近年来,质谱(MS)技术,特别是高分辨质谱(HRMS)和分子网络(Molecular Networking)分析,极大地加速了从复杂混合物(如天然产物提取物)中鉴定化合物的进程。然而,现有方法仍存在局限:质谱数据库和去重复(Dereplication)策略主要侧重于识别已知化合物,而对于发现具有全新骨架结构的未知化合物,缺乏有效的优先筛选方法。通常,研究人员从分子网络中筛选未注释的簇(Cluster)进行后续分离,但这种方法缺乏对结构新颖性的预判,可能导致工作量巨大而收获有限。因此,本研究旨在开发一种新的策略,能够在发现流程的早期阶段,优先筛选出具有高结构新颖性的化合物,从而提高新天然产物发现的效率和针对性。

本研究提出并验证了一种创新的工作流程,将分子网络分析与基于数据库的相对质量亏损(Relative Mass Defect, RMD)分析相结合。质量亏损(Mass Defect)是指单同位素质量与标称质量之间的差值,反映了元素的核结合能差异。相对质量亏损(RMD)则将质量亏损归一化到离子质量(以ppm为单位),其值主要受化合物中氢原子数量的影响。由于不同类别的化合物(如寡肽、脂质、萜苷)具有特征性的氢含量,因此其RMD值分布在不同范围。本研究利用这一原理,首先从天然产物数据库(如NPAtlas)中计算已知化合物的RMD值,并绘制特定属(如Nocardia, Amycolatopsis, Lentzea)的“RMD vs 分子量”参考图,图中用椭圆圈出不同化合物类别(如寡肽、聚酮、生物碱)的典型RMD分布区域。

具体工作流程如下: 1. 菌株选择与样品制备:研究从内部放线菌库中,基于对万古霉素的抗性和琼脂覆盖法测得的抗菌活性,优先选择了6株放线菌(Nocardia brasiliensis, N. cyriacigeorgica, Amycolatopsis japonica, A. echigonensis, A. lurida, Lentzea violacea)进行研究。这些菌株在三种发酵培养基中培养一周后,用乙酸乙酯和正丁醇萃取,得到有机提取物。 2. 质谱数据采集与分子网络构建:提取物经UHPLC-HRMS/MS分析。原始数据经MZmine 2预处理后,上传至全球天然产物社会分子网络(GNPS)平台构建分子网络。最终生成了包含3446个节点(Node)和456个簇(Cluster)的网络。 3. 候选簇的初步筛选:从分子网络中,依据三个标准筛选出可能含有新结构的候选簇:(i) 未被GNPS库注释;(ii) 包含5个或以上节点(提示可能存在结构类似物);(iii) 为特定属所独有(增加新颖性概率)。共筛选出28个候选簇。 4. RMD分析与新颖性预测:这是本研究的核心创新步骤。研究人员利用NPClassifier工具,从NPAtlas数据库中提取了与研究菌株同属(Nocardia, Amycolatopsis, Lentzea)的所有已知化合物信息及其结构分类。根据这些化合物的分子式,计算其理论RMD值,并绘制成各属的RMD参考图。随后,计算每个候选簇中节点的平均RMD值,并将其标记在对应属的参考图上。如果某个候选簇的平均RMD值落在某个已知化合物类别(如寡肽)的区域内,但其辅助数据(如紫外光谱、MS/MS谱图)与该类别的典型特征不符,则该簇被认为可能具有全新骨架,其结构变化导致了RMD值的显著偏移。这正是优先追踪的目标。 5. 目标化合物的分离与结构鉴定:应用上述方法,研究人员从Nocardia brasiliensis的提取物中锁定了一个目标簇(Cluster 1)。该簇的平均RMD值(557 ppm)落在Nocardia属已知寡肽类化合物的区域内,但其MS/MS谱中未观察到肽段碎片,紫外光谱也缺乏肽键和芳香氨基酸的特征吸收。这种不一致性提示其可能是一个全新类别的化合物。于是,对该簇对应的主要化合物进行了大规模发酵、提取和多种色谱分离,最终得到一种新的18元大环内酯,命名为Brasiliencin A (1)。 6. Brasiliencin A的完整结构解析:通过高分辨质谱(HRMS)确定其分子式为C39H62O13。综合运用一维和二维核磁共振谱(1H NMR, 13C NMR, 1H-1H COSY, HSQC, HMBC),并结合关键ROESY相关信号,确定了其平面结构为一个新颖的18元大环内酯,含有一个十氢化萘(Decalin)环系统和一个4’-O-甲基-β-吡喃葡萄糖单元。绝对构型的确定则综合运用了J基构型分析、量子化学计算(包括ROE距离和13C NMR化学位移计算)以及实验与理论电子圆二色谱(ECD)谱图对比。最终确定其绝对构型为2R, 4S, 5R, 8R, 9S, 10S, 11Z, 13S, 14E, 16S, 20E, 23R, 24R, 25R。 7. 生物合成基因簇分析:对Nocardia brasiliensis进行全基因组测序,并利用antiSMASH 7进行分析,发现了一个编码I型模块化聚酮合酶(PKS)的基因簇,命名为nsl。该基因簇包含1个装载模块和12个延伸模块,其酰基转移酶(AT)域的特异性(对甲氧基丙二酰-CoA、甲基丙二酰-CoA和丙二酰-CoA)与Brasiliencin A的结构单元完美匹配。酮基还原酶(KR)域的分析(模块2为A1型)支持了C-2位为R构型。基因簇中未发现周环酶或狄尔斯-阿尔德酶,推测十氢化萘环系统可能是通过自发的分子内[4+2]环加成反应形成。 8. 利用绝对质量亏损过滤(Absolute Mass Defect Filtering, AMDF)发现新衍生物:在发现Brasiliencin A后,为了寻找其类似物,研究人员采用了绝对质量亏损过滤(AMDF)技术。该方法基于目标化合物的核心骨架,设定一个中心分子式(C36H56O10)和质量亏损容差(0.0462 Da),从复杂的总离子流图(TIC)中过滤掉基质干扰离子,选择性提取具有相似质量亏损的离子。应用此方法,从N. brasiliensis提取物中发现了另外29个潜在的Brasiliencin类似物信号,这些信号原本被掩埋在总离子流图中。基于此,成功分离并鉴定了另外三个新的大环内酯:Brasiliencins B-D (2-4)。 9. Brasiliencins B-D的结构鉴定与活性测试: * Brasiliencin B (2):分子式与1相同(C39H62O13),为C-2位的差向异构体(2S构型)。通过ROESY(观察到H-2与H-13的相关)和ECD计算确认。 * Brasiliencin C (3):分子式为C38H60O13,与1相比,糖基部分的C-3’位缺少一个甲氧基。 * Brasiliencin D (4):分子式为C39H60O13,与2相比,C-23位的羟基被氧化为酮基。 * 抗菌活性测试:测试了这四种化合物对一系列细菌的抗菌活性,包括耻垢分枝杆菌(Mycobacterium smegmatis)、结核分枝杆菌(M. tuberculosis)以及一组从人类口腔微生物组中分离的病原菌。结果显示,Brasiliencin A (1)对耻垢分枝杆菌具有极强的抑制活性(MIC = 31.3 nM),并对口腔链球菌Streptococcus australis有微摩尔级别的抑制活性(MIC = 7.8 µM)。而仅在C-2位构型不同的Brasiliencin B (2)的活性显著降低(对耻垢分枝杆菌的MIC为1000 nM,活性降低约30倍;对S. australis的MIC为62.5 µM,活性降低约8倍)。其他测试菌株对四种化合物均不敏感(MIC > 100 µM)。这凸显了C-2位立体化学对活性的关键影响。

本研究的结论是,成功开发并验证了一种将分子网络与数据库衍生的相对质量亏损(RMD)分析相结合的系统性方法,用于在天然产物发现工作流程的早期优先筛选具有高结构新颖性的化合物。该方法通过比较未知代谢物簇的RMD值与已知化合物类别的RMD分布,并结合紫外和MS/MS等辅助数据的不一致性,能够有效识别出可能拥有全新骨架的候选分子。应用该方法从沙漠来源的细菌Nocardia brasiliensis中发现了全新的18元大环内酯类化合物Brasiliencin A及其生物合成基因簇。进一步,利用绝对质量亏损过滤(AMDF)技术高效地发现了该家族的更多衍生物,并成功分离鉴定了其中三个(Brasiliencins B-D)。活性研究表明Brasiliencin A对分枝杆菌具有强效且选择性的抑制活性,且其活性高度依赖于C-2位的立体构型。

本研究的价值与意义体现在多个层面: 1. 方法论创新:提出了一种全新的、数据驱动的天然产物发现策略。它弥补了传统分子网络在预测结构新颖性方面的不足,将化学信息学(RMD分析)与代谢组学(分子网络)和光谱学(UV, MS/MS)数据相结合,实现了对“未知的未知”化合物的理性筛选和优先排序,有望提高新骨架天然产物的发现效率。 2. 科学发现:发现了一类结构新颖的18元大环内酯化合物Brasiliencins,并阐明了其完整的立体结构。通过基因组学揭示了其生物合成途径,增进了对Nocardia属次级代谢产物多样性的认识。 3. 技术应用:展示了RMD分析和AMDF技术在天然产物研究中的强大实用性。RMD用于早期新颖性评估,AMDF用于快速发现同系物,两者结合构成了从发现到拓展的高效工具链。 4. 生物活性启示:Brasiliencin A对耻垢分枝杆菌的纳摩尔级活性及其对立体构型的敏感性,为其作为抗分枝杆菌先导化合物提供了重要线索,具有潜在的药物研发价值。

本研究的亮点包括: 1. 创新性的工作流程:首次将数据库衍生的RMD分析与分子网络结合,用于主动预测和优先筛选具有高结构新颖性的天然产物,而不仅仅是被动地注释未知节点。 2. 多学科技术融合:研究综合运用了代谢组学(分子网络)、化学信息学(RMD计算)、天然产物化学(分离与结构鉴定)、计算化学(构型与构象分析)、基因组学(生物合成基因簇分析)和药理学(活性测试),是典型的多学科交叉研究范例。 3. 从发现到机制的完整故事线:不仅发现了一个新化合物,还通过AMDF发现了其衍生物家族,通过基因组学推断了生物合成路径,并通过构效关系研究揭示了关键药效团,形成了一个完整的研究闭环。 4. 提供实用工具与思路:RMD参考图的构建方法和AMDF的应用为其他天然产物研究组提供了可直接借鉴或改编的技术方案,具有很高的推广价值。

此外,研究中关于Brasiliencin十氢化萘环系统可能通过非酶促的狄尔斯-阿尔德环加成反应形成的推测,以及通过KR域类型成功预测并验证C-2位绝对构型,都体现了将生物合成逻辑与化学研究深度结合的思路,具有启发性。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com