分享自:

人工智能用于神经退行性疾病治疗中的天然产物药物发现:综述

期刊:BiomoleculesDOI:10.3390/biom16010129

人工智能在神经退行性疾病天然产物药物发现中的应用:一篇综述报告

作者与发表信息

本文由Francesco Fontanella、Tiziana D’Alessandro、Emanuele Nardone、Claudio De Stefano(均来自意大利卡西诺和南拉齐奥大学“Maurizio Scarano”电气与信息工程系)、Caterina Vicidomini和Giovanni N. Roviello(均来自意大利国家研究委员会生物结构与生物成像研究所)共同撰写。这篇综述文章于2026年1月12日发表在期刊 Biomolecules 上。

综述主题与目标

本文是一篇系统性综述,其核心主题是探讨人工智能(AI)在神经退行性疾病(NDDs)治疗中,用于发现和优化具有神经保护作用的天然产物(NPs)的最新进展、策略与挑战。文章旨在系统性地梳理从传统的计算药物发现方法向专门针对天然产物化学复杂性和生物活性谱设计的AI驱动方法的转变,为读者提供一个从基础到应用的全面指南。

主要观点阐述

第一,神经退行性疾病的治疗挑战与天然产物的机遇。 文章开篇即指出,阿尔茨海默病(AD)、帕金森病(PD)、肌萎缩侧索硬化症(ALS)和亨廷顿病(HD)等神经退行性疾病是全球日益严峻的健康问题,尤其在老龄化人口中。当前的治疗手段大多仅能缓解症状,无法阻止疾病进展,这凸显了对具有真正神经保护作用、能在神经退行级联反应早期起效的干预措施的迫切需求。在此背景下,天然产物因其结构多样性和广泛的生物活性,成为极具潜力的神经保护化合物来源。然而,将天然产物转化为有效疗法面临生物利用度和药理学复杂性等挑战。与此同时,人工智能和机器学习(ML)正在彻底改变药物发现领域。AI的强大能力为驾驭天然产物的化学复杂性、预测其神经保护潜力提供了前所未有的工具。因此,天然产物科学与AI驱动计算策略的融合,被视为开发NDD疗法的一个充满希望的方向。

第二,具有神经保护潜力的主要天然产物类别及其作用机制。 文章详细综述了已被广泛研究的几类具有神经保护作用的天然产物,包括黄酮类(如橘皮素、川陈皮素、槲皮素、木犀草素)、多酚类(如白藜芦醇、姜黄素、咖啡酸、EGCG)、橄榄来源的酚类(如橄榄苦苷及其衍生物)、生姜来源的化合物(如6-姜酚、6-姜烯酚、姜酮)、银杏提取物、熊果酸、人参皂苷以及生物碱类(如小檗碱、石杉碱甲、哈尔明碱等)。文章通过表格和文本详细列举了这些化合物的主要神经保护作用,并强调尽管它们化学结构各异,但通常通过共同的机制发挥作用,包括:抗氧化活性、抗炎作用、线粒体功能保护、自噬调节以及干扰毒性蛋白聚集。同时,每一类化合物又具有独特的作用靶点,提供了互补的治疗潜力。这种“多靶点”特性使得天然产物特别适合应对神经退行性疾病这种多因素、多通路的复杂病理过程。文章也指出,许多天然产物的多靶点特性首先是通过分子对接、网络药理学等计算手段预测的,但仍需生化测定、表型筛选和多组学分析等实验手段进行最终验证。

第三,面向天然产物的AI驱动发现框架。 这是本文的核心技术部分,系统阐述了AI应用于神经保护性天然产物发现的关键组件和方法论。该框架包含以下几个相互关联的层面: * AI数据集与表示学习:高质量的数据集是AI应用的基础。文章介绍了多个重要的天然产物数据库,如COCONUT(最大的开放NP结构库)、NPASS(链接NP结构与生物活性数据)、LOTUS(基于知识图谱的NP资源)以及NP Atlas、GNPS、NP-MRD等专注于微生物代谢物或质谱/NMR数据的资源。这些数据库为机器学习模型提供了训练数据。然而,NP数据仍面临标注不完整、质量不一等挑战。表示学习技术(如扩展连通性指纹、基于图的表示、自动编码器)则负责将这些复杂的化学结构转化为适合机器学习分析的数学表示,能够捕捉NP特有的立体化学和复杂支架信息。 * 用于NP生物活性和靶点预测的机器学习:文章比较了多种机器学习模型在预测NP生物活性和分子靶点方面的应用。图神经网络(GNNs)因其能保留完整的分子拓扑结构而表现出色,已用于预测合成可及性和药物-靶点相互作用。Transformer架构则擅长处理SMILES字符串序列,能从质谱数据推导结构或生成多靶点配体。经典的机器学习方法(如支持向量机、随机森林)在小数据集上仍有价值。混合模型(如GNN-Transformer结合)结合了两种架构的优势,在预测血脑屏障(BBB)穿透性等关键性质方面显示出潜力。文章通过表格对比了不同AI架构的优缺点和适用场景。 * 生成式AI与类似物优化:生成式AI(如变分自动编码器VAEs、生成对抗网络GANs、基于Transformer的模型)能够设计新颖的NP类似物,在保留有益神经保护特性的同时,改善其生物利用度、代谢稳定性或合成复杂性。这些模型通过学习已知化合物的潜在空间,可以生成具有所需性质的新分子。强化学习策略则将分子设计视为序列决策过程,以多目标奖励函数(如靶点活性、选择性、类药性)为导向进行迭代优化。集成逆合成规划工具(如AiZynthFinder)可以评估生成结构的合成可行性, bridging the gap between computational design and practical drug development. * 系统药理学、基于图的整合与多组学数据融合:文章强调,天然产物通常作为多靶点调节剂在复杂的生物网络中发挥作用。系统药理学方法通过构建连接NP、分子靶点、生物通路和疾病表型的知识图谱,来理解NP如何在系统层面影响疾病网络。图机器学习算法可以分析这些网络,预测NP效应的传播路径,识别关键干预节点。多组学数据(基因组学、转录组学、蛋白质组学、代谢组学)的融合,能够提供NP对生物系统影响的更全面视图,揭示单组学数据无法发现的 emergent properties。例如,整合转录组和代谢组数据可以连接受扰动的通路与特定的生物活性化合物。数字孪生等新兴技术可以创建患者特异性计算模型,实现个性化的NP干预策略预测。

第四,AI辅助的天然产物在NDDs中发现的应用案例研究。 文章通过具体案例展示了AI方法在加速不同神经退行性疾病药物发现管道中的实际应用: * 阿尔茨海默病:研究团队利用支持向量机、人工神经网络和随机森林等机器学习模型,结合分子对接和动力学模拟,从天然产物数据库中筛选出具有亚纳摩尔级结合亲和力的乙酰胆碱酯酶抑制剂。另一项研究使用图神经网络编码药物-蛋白质-基因之间的异质关系,成功识别出能同时靶向神经炎症、线粒体功能障碍和葡萄糖代谢紊乱等多条AD关键病理途径的药物组合。 * 帕金森病:研究人员开发了结合随机森林回归器、高斯过程回归器和连接树变分自动编码器的结构式迭代学习框架,结合分子动力学模拟,发现了比先前报道的抑制剂强两个数量级的α-突触核蛋白聚集抑制剂。另一项研究采用集成机器学习方法(高斯过程、随机森林、支持向量回归)结合分子对接和动力学模拟,来识别LRRK2激酶抑制剂。此外,联邦学习技术被用于在多个研究机构间协作训练模型,以克服数据稀缺问题,识别协同治疗策略。 * 肌萎缩侧索硬化症与亨廷顿病:针对这些罕见病数据有限的挑战,迁移学习和少样本学习成为关键策略。例如,通过在大规模相关数据集上预训练模型,再在有限的疾病特异性数据上微调,可以有效地进行药物发现。一项研究利用整合的网络药理学方法,结合转录组数据分析和机器学习通路预测,发现人参皂苷Rg1和表儿茶素能通过调节MAPK14、GSK3B等通路,在酵母ALS模型中显著减少蛋白聚集,并得到了实验验证。

第五,挑战、机遇与未来方向。 文章在最后部分客观地指出了该领域面临的挑战与未来的发展方向: * 挑战: 1. 数据限制:NP数据存在碎片化、标注不完整、缺乏标准化生物活性测量和阴性样本等问题,导致模型可能存在偏差,泛化能力受限。 2. NP自身特性:NP常存在生物利用度差、代谢不稳定、结构复杂等问题,给优化和开发带来困难。 3. 模型可解释性:“黑箱”预测阻碍了机制理解,在安全和监管方面存在隐患。 4. 方法学评估:缺乏标准化的基准和评估协议,限制了不同研究之间的可重复性和可比性。 5. 生成式AI的挑战:涉及化学安全性、合成可行性及知识产权问题。 6. 转化与监管:监管框架尚未完全适应源自不透明或非确定性AI设计管道的化合物,标准化验证要求的缺失可能延迟审批。 * 机遇与未来方向: 1. 开发公开的基准NP数据集,并采用预定义的训练-验证分割。 2. 进行前瞻性验证研究,无论结果如何都报告AI优先推荐的候选物。 3. 在受控条件下系统比较预测模型和生成模型。 4. 常规整合不确定性量化,以指导实验决策。 5. 推动可解释AI(XAI)策略,如注意力机制、特征归因方法,以增强透明度和可追溯性。 6. 更深入地整合AI与系统药理学及多组学数据,模拟NP在多疾病阶段的 polypharmacological 和 context-dependent 效应。 7. 利用新兴技术,如空间组学、患者来源的iPSC模型和3D脑类器官,提高生物分辨率和转化相关性。 8. 探索量子计算和神经保护数字孪生等更具前瞻性的技术。

综述的意义与价值

本综述的系统性梳理具有重要的学术价值和指导意义。它清晰地勾勒出了人工智能技术与天然产物研究在神经退行性疾病治疗领域交叉融合的完整图景。文章不仅总结了当前最先进的AI方法(从数据表示、活性预测到生成设计和系统分析),还通过具体案例实证了这些方法的有效性,并坦诚地指出了当前面临的主要挑战和未来需要突破的方向。对于AI研究人员,本文指明了当前NP数据集的局限性、对不确定性感知和可解释模型的需求,以及阻碍公平模型比较的基准测试缺口。对于药物化学家和神经科学家,本文阐明了AI预测在哪些方面最可靠,强调了合成可行性和生物学验证的重要性,并概述了AI如何支持而非取代专家驱动的先导化合物优化。通过绘制方法论的优势和失败模式,这篇综述旨在支持更明智、更具协作性和可重复性的AI驱动NP发现工作。总体而言,它标志着该领域正从传统的经验筛选转向数据驱动、机制导向的理性发现新范式,为加速发现针对复杂神经退行性疾病的天然产物疗法提供了强大的路线图。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com