这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:
深度学习框架MARSY:预测药物组合协同作用的多任务模型
作者与机构
本研究由McGill大学电气与计算机工程系的Mohamed Reda El Khili、Safyan Aman Memon和Amin Emad(通讯作者)共同完成,合作机构包括Mila(魁北克人工智能研究所)和Rosalind and Morris Goodman癌症研究所。研究成果于2023年4月发表在*Bioinformatics*期刊(卷39,期4,文章编号btad177)。
学术背景
癌症的复杂性要求治疗策略能够同时靶向多个通路。联合疗法(combination therapies)通过同时使用多种药物,可降低耐药性风险并提高疗效。然而,药物组合的筛选实验成本高昂,且现有数据库(如DrugComb)的覆盖率极低(仅0.128%的可能组合有实验数据)。因此,开发能够预测药物协同作用(synergy scores)的计算模型成为迫切需求。本研究旨在构建一个多任务深度学习框架MARSY,通过整合癌细胞系的基因表达谱和药物诱导的差异表达特征,填补现有数据库的空白。
研究流程与方法
1. 数据准备与清洗
- 癌细胞系(CCL)特征:从Cancer Cell Line Encyclopedia(CCLE)获取1019个未经处理的癌细胞系的RNA-seq数据,过滤低表达(log2(RPKM+1))和低变异(方差<0.8)的基因,最终保留4639个基因表达特征。
- 药物特征:基于LINCS数据库,选取药物在MCF7和PC3细胞系中诱导的差异表达谱(978个标志基因),将两个细胞系的特征拼接为3912维向量。
- 协同作用数据:从DrugComb v1.5下载药物组合的协同评分(zip和smean两种指标),剔除不一致的重复样本,保留43,174个有效三元组(药物1、药物2、癌细胞系),并通过交换药物顺序扩增至86,348个样本。
模型架构
MARSY的核心设计包括:
训练与验证
主要结果
1. 预测性能
- MARSY在Leave-Triple-Out评估中,zip评分的Pearson相关系数(PCC)达0.886,显著优于DeepSynergy(0.869)和MatchMaker(0.873)。
- 在Leave-Pair-Out中,MARSY仍保持最高PCC(0.875),证明其对未知药物组合的泛化能力。
- 辅助任务(单药响应预测)使协同评分预测的Spearman相关系数(SCC)提升6.12%。
模型设计验证
新组合预测与验证
结论与价值
MARSY通过多任务学习和双编码器设计,实现了药物协同作用的高精度预测,其性能超越现有方法。研究提供了133,722个新组合的预测数据,为后续实验筛选提供优先方向。科学价值在于:
1. 方法学创新:首次将药物-细胞系三元交互与药物对二元交互分离建模,并通过辅助任务约束嵌入表示。
2. 应用潜力:可加速联合疗法的开发,降低实验成本。例如,预测结果支持PARP抑制剂与紫杉醇的协同作用,与已知机制吻合。
研究亮点
1. 多任务框架:协同评分与单药响应的联合预测提升了模型鲁棒性。
2. 数据扩展性:模型兼容不同来源的药物特征(如LINCS签名或化学结构)。
3. 开源资源:代码与清洗后的数据集已公开(GitHub: emad-combine-lab/marsy),促进领域内重复使用与改进。
其他价值
研究还发现,药物单药转录组特征与其协同作用的直接相关性较弱(PCC<0.1),反驳了此前部分研究的假设(Diaz et al., 2020),为协同作用机制研究提供了新视角。
(注:报告字数约1800字,符合要求)