这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:
DeepRescore2:基于深度学习的磷酸化肽段鉴定新方法及其在肝癌研究中的应用
作者及机构
本研究由Xinpei Yi(第一作者,现任职于上海交通大学生命科学技术学院)、Bo Wen(共同第一作者)、Shuyi Ji(复旦大学附属中山医院肝癌研究所)、Alexander B. Saltzman(贝勒医学院高级技术核心平台)、Eric J. Jaehnig、Jonathan T. Lei、Qiang Gao(复旦大学肝癌研究所)和Bing Zhang(通讯作者,贝勒医学院分子与人类遗传学系)共同完成,发表于2024年《Molecular & Cellular Proteomics》期刊第23卷第2期(DOI: 10.1016/j.mcpro.2023.100707)。
研究领域与动机
磷酸化蛋白质组学(phosphoproteomics)是研究蛋白质翻译后修饰(PTM)的核心领域,其中磷酸化修饰(phosphorylation)调控细胞信号通路、代谢和癌症发生等关键生物学过程。然而,传统基于质谱的“鸟枪法磷酸化蛋白质组学”(shotgun phosphoproteomics)面临两大挑战:
1. 低鉴定率:磷酸化肽段(phosphopeptide)的质谱图谱解析难度高,导致鉴定灵敏度不足;
2. 磷酸化位点定位不准:因缺乏决定性碎片离子(site-determining ions),假阳性率高。
研究目标
开发一种整合深度学习预测的计算流程DeepRescore2,通过改进保留时间(retention time, RT)和碎片离子强度(fragment ion intensity)预测,提升磷酸化肽段鉴定和位点定位的准确性,并应用于肝癌生物标志物发现。
研究分为四个核心步骤:
- 步骤1:深度学习模型训练
- 使用AutoRT(基于LSTM的保留时间预测模型)和pDeep3(碎片离子强度预测模型),通过实验特异性数据微调(fine-tuning)预训练模型。
- 训练集:从U2OS骨肉瘤细胞系和CPTAC子宫内膜癌(UCEC)数据集中筛选高置信度磷酸化肽段(PSM FDR <1%,位点定位概率>0.75)。
步骤2:磷酸化位点定位优化
步骤3:PSM重评分(rescoring)
步骤4:可视化验证
合成数据集测试:
真实生物数据集验证:
方法学优势:
生物学发现:
科学意义:
- 首次将深度学习预测的保留时间和碎片离子强度整合至磷酸化数据分析全流程,解决了低鉴定率和位点模糊性难题;
- 为大规模磷酸化蛋白质组学研究提供了标准化工具(代码开源:GitHub/bzhanglab/deeprescore2)。
应用价值:
- 发现EGFR_Y1068可作为肝癌靶向治疗标志物,推动阿法替尼的临床转化研究;
- 揭示SRPK1-RS结构域磷酸化网络在肝癌中的调控作用,为RNA剪接异常机制提供新视角。
技术创新:
跨学科融合:
数据资源:
(全文约2000字)