分享自:

基于多模态深度学习的药物组合协同预测方法

期刊:BioinformaticsDOI:10.1093/bioinformatics/btad438

这篇文档属于类型a,即报告了一项原创性研究的科学论文。以下是针对该研究的学术报告:


DeepTraSynergy:基于多模态深度学习和Transformer的药物组合协同效应预测研究

一、作者与发表信息

本研究由Fatemeh Rafiei(德黑兰医科大学公共卫生学院)、Hojjat Zeraati(同单位)、Karim Abbasi(卡拉兹米大学)、Jahan B. Ghasemi(德黑兰大学)等合作完成,通讯作者为Mahboubeh ParsaeianAli Masoudi-Nejad。论文发表于Bioinformatics期刊2023年第39卷第8期,标题为《DeepTraSynergy: Drug Combinations Using Multimodal Deep Learning with Transformers》,开放获取地址为Oxford Academic


二、学术背景

科学领域:本研究属于结构生物信息学(Structural Bioinformatics)人工智能药物发现的交叉领域,聚焦于抗癌药物组合的协同效应预测。

研究动机
1. 临床需求:单一药物治疗癌症易产生耐药性,而多药联用(Drug Combinations)可通过靶向不同通路增强疗效并减少副作用,但实验筛选组合的成本极高(如DrugCombDB数据库包含近700万种组合)。
2. 技术瓶颈:现有计算方法(如随机森林、图神经网络)难以充分整合药物-靶点互作(Drug-Target Interaction, DTI)、蛋白质互作网络(Protein-Protein Interaction, PPI)和细胞-靶点互作等多模态数据。
3. 创新目标:提出DeepTraSynergy模型,首次将Transformer架构引入药物分子特征提取,并通过多任务学习(Multitask Learning)联合预测协同效应、毒性和DTI,提升预测精度。


三、研究流程与方法

1. 数据准备与输入
  • 数据集
    • DrugCombDB(69,436对药物组合,764种药物,76种细胞系)
    • Oncology-Screen(4,176对组合,21种药物,29种细胞系)
  • 输入模态
    • 药物分子SMILES序列
    • PPI网络(Node2Vec编码蛋白质特征)
    • 细胞-靶点互作矩阵
2. 模型架构

核心模块
1. 药物特征提取网络
- 基于Vision Transformer改进,将SMILES序列分块(Patch Size=40,重叠率50%)嵌入,通过多层Transformer编码器捕获长程依赖关系。
- 创新点:首次将Transformer用于药物分子表示学习,优于传统图卷积网络(GCN)。

  1. 蛋白质互作网络(PPI)处理

    • 使用Node2Vec对PPI网络节点编码,通过K-means聚类(300类)降维,减少计算负担。
  2. 多任务预测网络

    • 主任务:协同效应预测(Synergy Loss,二元交叉熵)
    • 辅助任务
      • 药物-靶点结合亲和力(DTI Loss,单类分类损失)
      • 毒性预测(Toxic Loss,避免靶点重叠暴露)
    • 融合策略:通过多层感知机(MLP)整合药物-靶点互作矩阵与细胞系特征。
3. 实验设计
  • 基准对比:与7种现有方法(如DeepSynergy、GraphSynergy)对比,采用5折交叉验证。
  • 评价指标:AUC-ROC、AUC-PR、准确率(Accuracy)、F1分数。
  • 消融实验:验证各模块(如Transformer、毒性损失)的贡献。

四、主要结果

  1. 性能优势

    • 在DrugCombDB上,DeepTraSynergy的AUC-PR达0.8487,比次优模型(GraphSynergy)提升3.27%;在Oncology-Screen上准确率80.52%(表3-4)。
    • 关键发现:引入PPI和DTI知识使协同效应预测显著提升(P<0.05,t检验)。
  2. 消融分析

    • 单独使用Transformer特征提取器(无多任务)已优于传统方法,证实Transformer的药物表示能力。
    • 毒性损失函数(L_toxic)有效减少靶点重叠导致的副作用(公式2)。
  3. 跨数据集验证

    • 在O’Neil数据集训练的模型迁移至DrugCombDB时,AUC-PR仍达0.7659(图4),显示强泛化能力。
  4. 新组合预测

    • 预测Top 10协同组合(如Temsirolimus+Everolimus),其中5组经文献验证(表9),如肾癌治疗中Temsirolimus的已知疗效。

五、结论与价值

  1. 科学意义

    • 提出首个结合Transformer和多任务学习的药物协同预测框架,为多模态数据融合提供新范式。
    • 证实蛋白质互作网络和毒性约束对预测的关键作用。
  2. 应用价值

    • 开源代码(GitHub)可供药物研发机构快速筛选候选组合,降低实验成本。
    • 预测结果可指导临床前研究,如A375黑色素瘤细胞系的联合用药方案。

六、研究亮点

  1. 方法创新

    • 将Transformer应用于药物SMILES序列分析,突破传统GCN的局限性。
    • 多任务损失函数设计(协同+毒性+DTI)提升模型鲁棒性。
  2. 数据规模

    • 涵盖近7万对药物组合,是目前最大规模的验证之一。
  3. 可解释性

    • 通过SHAP值分析靶点模块贡献,增强模型可信度(补充材料)。

七、其他价值

  • 资源贡献:发布Top 100预测组合清单,助力后续实验验证。
  • 未来方向:计划结合蛋白质结合口袋(Pocket)信息进一步优化模型。

(报告完)


注:术语对照
- SMILES:简化分子线性输入规范
- Node2Vec:节点嵌入算法
- MLP:多层感知机
- AUC-ROC:受试者工作特征曲线下面积
- AUC-PR:精确率-召回率曲线下面积

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com