分享自:

挖掘隐藏的药典:真菌内生菌、天然产物与人工智能驱动的药物发现兴起

期刊:International Journal of Molecular SciencesDOI:10.3390/ijms27031365

人工智能驱动的药物发现新前沿:挖掘真菌内生菌隐藏的天然产物宝库

作者与发表信息 本文由来自阿联酋艾因大学(Al Ain University)药学院的Ruqaia Al Shami和埃及曼苏拉大学(Mansoura University)药学院的Walaa K. Mousa共同撰写,发表于国际分子科学杂志Int. J. Mol. Sci. 2026年1月29日。

论文主题与性质 本文是一篇系统性综述,其核心主题是探讨人工智能(Artificial Intelligence, AI)技术如何变革性地推动从真菌内生菌中发现天然产物(Natural Products, NPs)的进程。文章旨在系统梳理真菌内生菌产生的多样化天然产物化学类别及其生物活性,并全面阐述当前AI和机器学习(Machine Learning, ML)工具如何整合多组学数据,将传统的经验性天然产物发现模式转变为一种预测性、可设计的现代化研究范式。

主要观点阐述

第一,天然产物的独特价值与真菌内生菌的巨大潜力 文章开篇强调了天然产物在药物研发中的不可替代性。与针对单一靶点的合成分子不同,天然产物通常具有复杂的立体化学结构和多靶点、系统水平的生物活性,这符合网络药理学(Network Pharmacology)原理,能以协调、非破坏性的方式调节生物通路,从而减少耐药性、缓冲代偿反馈回路并增强治疗韧性。历史上,1981年至2019年间,超过一半获批的小分子药物是天然产物或其衍生物,证明了其“特权骨架”的地位。

在众多天然产物来源中,真菌内生菌因其与宿主植物长期共进化而成为一个化学多样性极高且生物学上极为精妙的天然产物库。它们能够产生聚酮(Polyketides)、生物碱(Alkaloids)、萜类(Terpenoids)和肽类等具有复杂三维结构和新兴生物活性模式的化合物。然而,传统的发现方法面临诸多挑战:频繁的已知化合物再发现、大量生物合成基因簇(Biosynthetic Gene Clusters, BGCs)在标准实验室条件下处于“沉默”状态、分离流程耗时耗力且效率低下。这导致了本世纪初天然产物研究在制药工业中的一度衰退。

第二,人工智能与多组学整合重塑天然产物发现格局 近年来,人工智能、机器学习、深度学习(Deep Learning)以及多组学(Multi-omics)数据的爆炸式增长,为天然产物研究的复兴提供了强大动力。AI技术正在从多个维度重塑这一领域: 1. 基因组挖掘(Genome Mining):AI工具如antiSMASH、DeepBGC、GECCO等,能够以前所未有的精度和速度从真菌基因组中识别、分类和优先排序BGCs,将过去难以处理的代谢组和隐秘的BGCs转化为可预测、可工程的系统。这有助于揭示真菌内生菌中隐藏的生物合成潜力。 2. 代谢组学注释与去重复(Metabolomic Annotation and Dereplication):基于AI的平台如GNPS(Global Natural Products Social Molecular Networking)、SIRIUS/CSI:FingerID和MS2LDA,能够从复杂的液相色谱-串联质谱(LC-MS/MS)数据中提取结构和亚结构信息,快速识别已知化合物(去重复),并聚类结构相关的代谢物家族,从而聚焦于新颖化合物的发现。 3. BGC-代谢物关联与结构预测:工具如PRISM、NRPSpredictor2/Sandpuma能够从BGC的基因序列预测其可能编码的化学骨架,实现基因组信息与代谢组学数据的关联,指导目标化合物的靶向分离。 4. 沉默途径的激活:深度学习框架可以预测能够激活沉默BGCs的环境或调控线索,从而在实验室条件下诱导产生新的代谢物,解锁内生菌未被开发的代谢潜力。 5. 生成式AI与从头设计:生成式人工智能和扩散模型(Diffusion Models)能够从头设计受天然产物启发的分子骨架,同时兼顾生物合成的可行性,为天然产物的结构优化和全新设计开辟了新途径。 6. 蛋白质结构预测与通路工程:以AlphaFold2为代表的蛋白质结构预测技术的突破,为理性修饰生物合成酶和进行通路工程(Pathway Engineering)铺平了道路。

这种AI驱动的转型为工业界带来了更短的发现周期、更高的先导化合物(Hit-to-Lead)转化率、更强的知识产权定位以及更具前景的生物学验证起点。

第三,真菌内生菌代谢产物的化学多样性全景图 文章的核心部分详细综述了从真菌内生菌中分离得到的主要天然产物化学类别,并提供了丰富的化合物结构图和表格(表1,图1-7)作为证据。这些类别包括: * 生物碱:如抗癌药物长春碱(Vinblastine)、长春新碱(Vincristine)和喜树碱(Camptothecin)及其衍生物,均能从相应的植物内生真菌中产生,体现了代谢趋同。其他如胡椒碱(Piperine)、小檗碱(Berberine)、石杉碱甲(Huperzine A)等也具有广泛生物活性。 * 聚酮类:这是结构最多样化的类别之一,包括Outovirin C、Phomopsolides系列、Murrano系列化合物、Palmarumycin家族等,具有抗真菌、抗菌、细胞毒等多种活性。 * 萜类和萜类化合物:最著名的例子是紫杉醇(Paclitaxel/Taxol),已从多种内生真菌中分离得到。此外还包括Withanolides、Sclerodols、银杏内酯(Ginkgolides)等。 * 非核糖体肽(Nonribosomal Peptides, NRPs):如Trichodermamide C、Fusarithioamide A、Cryptocandin等,常具有环状结构、特殊氨基酸和显著的抗菌、抗真菌活性。 * 酚类和芳香族化合物:如麦角甾醇(Ergosterol)、Xanalteric acids、Mollicellins等,具有抗菌、抗氧化和细胞毒活性。 * 黄酮类:传统上认为由植物合成,但也在内生真菌中发现,如芹菜素(Apigenin)、木犀草素(Luteolin)、槲皮素(Quercetin)等,表明存在代谢趋同或水平基因转移。 * 甾体类:如(22E,24R)-Stigmasta-5,7,22-trien-3β-ol,具有抗疟、抗菌活性。 * 杂合及其他类型代谢物:包括细胞松弛素(Cytochalasins)、Torreyanic acid、Diaportheone B等,结构独特,生物活性广泛。

文章通过表1系统总结了这些化合物的来源真菌、宿主植物及其报道的生物活性,为读者提供了一个全面的资源目录。

第四,从概念到实施:AI在天然产物发现中的具体应用与工具 文章详细列举并阐述了当前用于天然产物发现的各类AI工具(总结于表2),将其分为几大功能模块: * 基因组挖掘与BGC预测工具:如antiSMASH(使用ML支持的启发式方法)、DeepBGC(使用深度学习算法)、GECCO(基于条件随机场的深度学习)等,用于发现新的生物合成基因簇。 * AI辅助的代谢组学与质谱分析工具:如GNPS(利用MS/MS谱网络进行分子网络分析)、SIRIUS/CSI:FingerID(利用碎片树算法和深度神经网络预测结构)、MS2LDA(应用主题建模识别质谱子结构 motif)等,用于化合物注释、去重复和结构解析。 * AI辅助的靶点识别与生物活性预测工具:如Chemprop(图神经网络模型),用于预测天然产物的ADMET性质、生物活性和类药性。 * 生成式AI与计算机辅助设计工具:生成对抗网络(GANs)、变分自编码器(VAEs)、扩散模型等可用于设计新型天然产物样支架。 * AI辅助的蛋白质结构预测工具:如AlphaFill,用于在预测的蛋白质模型中添加辅因子、底物或配体,指导酶工程。 * AI辅助的微生物网络与生态学工具:利用机器学习模型(如自组织映射SOM)分析微生物共现模式,预测与天然产物生物合成相关的生态互作。 * AI辅助的合成生物学与BGC工程工具:如RetroBioCat,利用机器学习进行逆生物合成分析和生物合成路径设计。

这些工具共同构成了一个从基因到功能、从数据到设计的完整AI驱动发现生态系统。

第五,临床转化管线与未来展望 文章列举了已成功从内生真菌来源进入临床的天然产物实例,如紫杉醇(Palixital)、长春碱及其类似物(如拓扑替康Topotecan),证明了这一资源的实际应用价值。然而,传统发现方法的局限性(如再发现率高、沉默BGCs、流程漫长)制约了其潜力。

AI的整合有望彻底改变这一局面。通过将进化优化的化学多样性与现代计算智能相结合,该领域正迈向一个新时代。在这个时代,天然产物先导化合物不仅被重新发现,更能被系统地扩展、工程化和工业化,以应对紧迫的生物医学和可持续发展挑战,如抗菌素耐药性、癌症治疗、植物抗逆性和微生物组疗法等。

论文的意义与价值 本综述具有重要的学术价值和指导意义: 1. 系统性整合:首次将真菌内生菌丰富的化学多样性与快速发展的AI驱动工具生态系统进行系统性对接和综述,为跨领域研究人员提供了清晰的路线图。 2. 资源目录:详尽汇总了内生真菌来源的各类天然产物及其生物活性,并附有化学结构和详细信息,本身即是一个宝贵的研究数据库。 3. 技术指南:全面梳理和评价了当前可用于天然产物发现的各类AI工具、其原理、优势与局限,为实验科学家选择和应用这些工具提供了实用指南。 4. 前瞻性视角:明确了AI如何将天然产物发现从经验筛选转变为预测性、假设驱动的学科,并展望了其与合成生物学结合实现精准生物制造的工业前景。 5. 推动领域发展:通过强调AI与多组学整合的策略,本文旨在激励更多研究者采用计算与实验相结合的方法,加速从真菌内生菌这一“隐藏的药典”中挖掘新药先导化合物的进程,为解决全球健康挑战提供创新解决方案。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com