基于图神经网络的Cox比例风险模型增强及其在癌症预后中的应用

一、研究背景与学科前沿 癌症预后分析一直是医学领域的核心研究方向。近年来,随着高通量测序技术(high-throughput sequencing technologies)的广泛应用,科学家们得以深入探索癌症患者的分子生物标志物(biomarker)和临床特征,从而帮助临床医生更准确地评估患者的生存风险,制定个体化治疗策略。传统的 Cox 比例风险模型(Cox proportional hazards model)作为经典的生存分析工具,因其优秀的统计基础和适应性而被广泛应用于癌症预后研究。 然而,随着深度学习(Deep Learning, DL)以及多组学(omics)数据的引入,科学家们逐步认识到传统 Cox 模型在特征提取和复杂关系建模方面的不足。许多基于深度学习的方法往往侧重于特征...

基于预训练大语言模型的人类蛋白质必要性的全面预测与分析

基于预训练大型语言模型的人类蛋白质必要性预测与分析 学术背景 人类必需蛋白质(Human Essential Proteins, HEPs)对个体的生存和发育至关重要。然而,实验方法识别HEPs通常成本高、耗时长且劳动强度大。此外,现有的计算方法仅在细胞系水平上预测HEPs,但HEPs在活体人类、细胞系和动物模型之间差异显著。因此,开发一种能够在多个水平上全面预测HEPs的计算方法显得尤为重要。最近,大型语言模型(Large Language Models, LLMs)在自然语言处理领域取得了显著成功,蛋白质语言模型(Protein Language Models, PLMs)也因其能够在大规模蛋白质序列上进行预训练而崭露头角。然而,PLMs是否能够显著提高蛋白质必要性预测任务的效果仍然未知...