人工智能驱动小分子药物研发:精准癌症免疫治疗的新范式
作者与发表信息 本文由 Henry Sutanto 与 Deasy Fetarayani 共同撰写,作者单位分别为印度尼西亚艾尔朗加大学(Universitas Airlangga)医学院内科学系及其附属 Dr. Soetomo 总医院。该文章发表于 npj | drug discovery 期刊,作为一篇“Perspective”(观点)文章于2025年发表。
文章主题 本文旨在全面审视人工智能(AI)技术如何变革精准癌症免疫调节疗法中小分子药物的研发。文章系统性地阐述了AI在从头设计、虚拟筛选、多参数优化以及ADMET(吸收、分布、代谢、排泄和毒性)预测等关键环节的应用,并深入探讨了其在患者分层、多组学数据整合、数字孪生模拟以及当前面临的挑战和未来发展方向。
主要观点阐述
一、 癌症免疫疗法与小分子免疫调节剂的兴起 癌症免疫疗法通过调节免疫系统来对抗肿瘤,主要包括免疫检查点抑制剂(ICIs)、过继细胞疗法、细胞因子疗法等。然而,以单克隆抗体为主的传统免疫疗法存在局限性,如免疫耐药、免疫相关不良事件、生产成本高、组织穿透性有限等。相比之下,小分子药物因其口服生物利用度高、组织穿透性好(尤其对实体瘤)、生产成本低、化学可调性强、可靶向细胞内靶点等独特优势,成为极具潜力的补充或替代策略。文章列举了针对IDO1、PD-L1等靶点的小分子抑制剂(如epacadostat, PIK-93)的研发进展,并指出AI技术是加速发现和优化这类分子的关键驱动力。
二、 AI在药物发现中的技术基础 AI技术,特别是机器学习(ML)、深度学习(DL)和自然语言处理(NLP),正在重塑药物研发的各个阶段,从靶点识别到临床试验优化。 * 机器学习技术:包括监督学习(用于QSAR建模、ADMET预测)、无监督学习(用于化学空间探索、分子聚类)和强化学习(用于分子生成和多目标优化)。文章通过表格详细对比了这些方法在药物发现中的应用、算法、数据需求和优缺点。 * 深度学习技术:DL模型,如卷积神经网络(CNNs)、图神经网络(GNNs)、变分自编码器(VAEs)和生成对抗网络(GANs),能够处理高维复杂数据,在分子生成、结合亲和力预测等方面表现出色。表格对比了不同DL架构的特点和应用。 * 自然语言处理技术:NLP用于从海量生物医学文献和专利中自动提取药物、靶点、疾病关系等信息,加速知识发现和靶点验证。 * 数据源与预处理:AI模型依赖高质量数据。文章强调了多组学数据(基因组学、转录组学、蛋白质组学)、高通量筛选(HTS)数据以及体外生化/细胞实验数据的重要性。AI与HTS的结合(如Chemprint、AtomNet平台)能显著提高命中率和效率。数据预处理、模型训练、验证(如基于骨架的拆分、外部验证)和可解释性方法(如SHAP、LIME)是确保模型可靠和可用的关键步骤。
三、 AI驱动的小分子设计工作流程 这是本文的核心部分,详细介绍了AI如何应用于小分子免疫调节剂研发的具体环节。 * 从头分子生成:利用生成模型(如基于SMILES的RNN、GNNs、VAEs、GANs)结合强化学习(RL),可以从头设计和优化具有特定性质(如靶向PD-L1/IDO1、高结合力、良好类药性)的全新分子结构。例如,3D-MolGNNRL系统使用RL在靶点结合口袋内逐原子构建分子。 * 虚拟筛选与结合亲和力预测:AI方法极大地加速了从大型化合物库中筛选活性分子的过程。ML增强的定量构效关系(QSAR)模型和基于DL的结构预测模型(如3D-CNNs、Transformer-based模型如TF-DTA)能够更准确地预测药物-靶点相互作用(DTI)和结合亲和力,替代或辅助传统的实验筛选。 * ADMET与药代动力学预测:不良的ADMET特性是临床试验失败的主要原因。AI框架(如ADMET-AI、Deep-PK)能够大规模、快速、准确地预测候选化合物的吸收、分布、代谢、排泄和毒性性质,实现早期筛选和优化,降低研发成本和失败率。
四、 适用于小分子干预的癌症免疫治疗靶点 文章系统梳理了AI可用于设计小分子药物的关键免疫治疗靶点领域。 * 免疫检查点:除了PD-1/PD-L1、CTLA-4,文章重点讨论了IDO1、VISTA等靶点。AI通过QSAR、分子对接、深度学习等方法,加速了新型小分子检查点抑制剂(如破坏PD-L1二聚体、促进其降解的分子)的发现和优化。多个研究案例展示了ML模型(如随机森林、XGBoost)和集成模型(如IDO1Stack)在虚拟筛选和发现新型IDO1抑制剂(如丹参酮类衍生物)中的成功应用。 * 肿瘤微环境(TME)调节:靶向TME中的免疫抑制因子,如TGF-β通路和腺苷A2A受体(A2AR)。AI平台(如AI-HOPE-TGFbeta)可整合临床和基因组数据探索通路失调。生成式化学语言模型与基于结构的药物设计(SBDD)结合,可从头设计A2AR配体,实验验证命中率高。 * 抗原呈递与新抗原通路:针对肿瘤下调抗原加工和呈递机制(APM)的免疫逃逸,AI可用于设计能够恢复或增强MHC分子表达的小分子(如HSP90抑制剂、FASN抑制剂)。 * 代谢重编程:靶向精氨酸酶(ARG1/2)和IDO1等代谢酶,逆转免疫抑制。AI辅助发现了如OATD-02、CB-1158、RG70099等小分子抑制剂,并用于优化其药代动力学特性。
五、 精准肿瘤学与AI驱动分子设计的结合 AI是实现个性化免疫治疗的关键。 * 患者分层:通过整合多组学数据和影像组学,AI模型(如无监督聚类、监督分类)可以识别对特定疗法(包括小分子免疫疗法)可能响应的患者亚群。例如,基于免疫基因组特征将肿瘤分为“热”或“冷”表型,或使用CheckpointPxDL模型从CT影像预测ICI疗效。 * 多组学整合用于个性化设计:AI能够整合基因组、转录组、蛋白质组数据,构建全面的肿瘤免疫图谱,用于预测免疫原性新抗原,指导个性化癌症疫苗设计(如EVX-01/02疫苗)。 * 数字孪生与模拟平台:数字孪生是患者的动态虚拟模型,整合了临床、分子等多维度数据。AI驱动的数字孪生(如MLPA、TDT框架)可以模拟不同治疗方案(包括小分子免疫调节剂)在个体患者身上的效果,优化给药方案和预测疗效,甚至集成大语言模型(如DT-GPT)进行健康轨迹预测。
六、 AI辅助小分子免疫调节疗法的应用案例 文章列举了具体案例展示AI的应用价值。 * AI设计的IDO1抑制剂:介绍了使用集成机器学习模型(IDO1Stack)、2D-QSAR、深度学习DTI预测工具(DeepPurpose)等方法发现和优化IDO1抑制剂的研究,展示了从预测到实验验证的完整流程。 * GENTRL与强化学习用于免疫靶点:介绍了生成式张量强化学习(GENTRL)框架如何快速生成具有理想特性的新分子,并探讨了其在免疫检查点靶点(如PD-L1)上的应用潜力。 * STING激动剂的发现:概述了通过结构导向设计和AI辅助SBDD发现新型、口服生物可利用的STING小分子激动剂(如SB 11285, MSA-2, ZSA-51)的过程,并提及AI在预测其生物标志物方面的作用。 * 学术界与工业界的合作:以Insilico Medicine、Exscientia、BenevolentAI等AI生物技术公司与大型药企(如GSK、赛诺菲、百时美施贵宝)的合作为例,说明了产学研合作在加速AI驱动的免疫肿瘤学管线开发中的关键作用。
七、 挑战与局限性 尽管前景广阔,AI在免疫治疗药物发现中仍面临多重挑战。 * 数据质量与可用性:高质量、标准化数据的缺乏是主要瓶颈。数据噪声、标注错误、算法偏见(如对某些靶点或分子骨架的过度代表)以及免疫数据集的不完整/偏倚,都会影响模型的泛化能力。关键免疫靶点(如VISTA)缺乏高分辨率结构数据也限制了基于结构的设计。 * 模型可解释性与信任:深度学习模型的“黑箱”特性阻碍了其在临床和监管环境中的信任建立。需要可解释AI(XAI)技术(如SHAP、LIME)来阐明模型的决策依据,以满足监管要求和辅助专家决策。 * 转化障碍:从计算机设计到临床应用的转化存在巨大鸿沟。许多AI生成的分子在体外表现良好,但可能因药代动力学、脱靶效应或免疫原性问题在体内失败。缺乏标准化的转化验证框架(如人源化小鼠模型、3D TME平台)和明确的AI药物监管路径是主要障碍。此外,涉及患者敏感数据的个性化治疗也引发了数据隐私、算法公平性和伦理方面的担忧。
八、 未来方向 文章展望了AI驱动药物发现的未来趋势。 * 与高通量筛选和实验室自动化的整合:构建“设计-合成-测试-学习”的闭环自动化系统,将AI分子生成与机器人合成、自动化表型筛选无缝连接,可极大加速研发进程。 * 联邦学习与安全数据共享:联邦学习(FL)允许多个机构在不共享原始数据的情况下协同训练AI模型,有助于在保护患者隐私和商业机密的同时,利用更广泛的数据集(如Melloddy项目),解决数据孤岛问题。 * 量子计算在药物设计中的作用:量子计算有望通过精确模拟分子电子结构和反应路径,革命性地提升分子模拟和优化能力。量子计算与AI的融合,可能解决传统方法难以处理的复杂计算问题,如高精度结合能计算。
文章意义与价值 本文是一篇全面、深入且具有前瞻性的综述。它不仅系统梳理了AI在癌症免疫治疗小分子药物发现全链条中的应用技术、具体靶点和成功案例,还客观分析了当前面临的数据、模型、转化和伦理挑战,并指明了与自动化平台、联邦学习、量子计算结合的未来发展方向。这篇文章为研究人员、药物开发者以及相关领域学者提供了宝贵的路线图和技术参考,强调了AI作为变革性工具,在推动开发更有效、更个性化的小分子免疫调节疗法方面的巨大潜力,对于促进精准肿瘤学的发展具有重要的学术价值和实践指导意义。