分享自:

基于深度学习的阿尔茨海默病多基因风险分析

期刊:Communications MedicineDOI:10.1038/s43856-023-00269-x

该文档属于类型a,以下是基于文档内容的学术报告:


深度学习在多基因风险分析中的应用:阿尔茨海默病预测研究

作者及机构
本研究由Xiaopu Zhou、Yu Chen、Fanny C. F. Ip、Yuanbing Jiang、Han Cao、Ge Lv、Huan Zhong、Jiahang Chen、Tao Ye、Yuewen Chen、Yulin Zhang、Shuangshuang Ma、Ronnie M. N. Lo、Estella P. S. Tong、Vincent C. T. Mok、Timothy C. Y. Kwok、Qihao Guo、Kin Y. Mok、Maryam Shoai、John Hardy、Lei Chen、Amy K. Y. Fu及Nancy Y. Ip等多位研究者共同完成。研究团队来自香港科技大学、香港中文大学、阿尔茨海默病神经影像倡议(Alzheimer’s Disease Neuroimaging Initiative, ADNI)等多个机构。该研究于2023年发表在Communications Medicine期刊上。

学术背景
阿尔茨海默病(Alzheimer’s Disease, AD)是一种多基因疾病,其发病风险由多个遗传变异共同决定。传统的统计分析方法在处理高维基因组数据时存在局限性,无法全面捕捉多基因风险。深度学习(Deep Learning)方法因其能够捕捉高维数据中的非线性关系,可能为AD风险预测提供更准确的工具。本研究旨在开发基于深度学习的神经网络模型,用于AD多基因风险建模,并探索其在疾病机制研究中的应用。

研究流程
1. 数据收集与预处理
研究纳入了来自美国国家老龄化研究所阿尔茨海默病中心(ADC)、晚发性阿尔茨海默病家族研究(LOAD)和ADNI三个队列的基因数据,以及两个中国全基因组测序(Whole-Genome Sequencing, WGS)队列的数据。样本包括AD患者、轻度认知障碍(Mild Cognitive Impairment, MCI)患者和正常对照(Normal Controls, NCs)。数据经过质量控制(Quality Control, QC)和插补(Imputation)处理,以确保分析的准确性。

  1. 模型构建与比较
    研究构建了基于深度学习的神经网络模型,并与广泛使用的加权多基因风险评分(Weighted Polygenic Risk Score, PRS)和Lasso模型进行比较。神经网络模型采用七层结构,包含多个隐藏层和Dropout层,以捕捉多基因风险的非线性关系。模型训练过程中使用了交叉验证(Cross-Validation)和独立验证(Independent Validation)策略,以避免过拟合。

  2. 多基因风险分析
    研究基于AD全基因组关联研究(Genome-Wide Association Study, GWAS)的总结统计量,选择了不同p值阈值下的遗传变异进行模型构建。通过计算受试者工作特征曲线下面积(Area Under the Receiver Operating Characteristic Curve, AUROC)和精确召回曲线下面积(Area Under the Precision-Recall Curve, AUPRC)来评估模型的分类性能。

  3. 疾病机制探索
    研究进一步分析了多基因风险与AD内表型(如血浆生物标志物和认知功能)之间的关系。通过无监督聚类(Unsupervised Clustering)方法,将个体根据神经网络模型隐藏层的输出进行分层,以识别不同病理机制下的亚组。

主要结果
1. 模型性能
深度学习模型在AD风险分类中的表现优于加权PRS和Lasso模型。例如,在包含8100个SNP的模型中,神经网络模型的AUROC达到0.84,显著高于PRS(AUROC=0.70)和Lasso模型(AUROC=0.81)。此外,神经网络模型在跨种族验证中也表现出较高的分类准确性。

  1. 多基因风险与疾病机制
    研究发现,多基因风险与AD相关的血浆生物标志物(如Aβ42、p-tau181和NFL)显著相关。通过无监督聚类,研究将个体分为低、中、高风险组,发现高风险组中AD患者的比例显著增加。此外,多基因风险还与特定脑区(如海马体和灰质)的体积变化相关。

  2. 生物学通路分析
    研究通过基因本体(Gene Ontology, GO)和蛋白质相互作用网络分析,发现多基因风险主要与免疫相关通路(如TNF-α和细胞因子信号通路)相关。这些结果表明,AD多基因风险可能通过调控免疫相关通路影响疾病进展。

结论
本研究首次将深度学习方法应用于AD多基因风险分析,展示了其在疾病风险预测和机制研究中的潜力。深度学习模型不仅能够更准确地分类AD风险,还能通过分析隐藏层的输出揭示疾病相关的生物学通路。此外,研究还表明,多基因风险模型在不同种族群体中具有一定的通用性,为跨种族AD风险预测提供了新的思路。

研究亮点
1. 深度学习模型的优越性:神经网络模型在AD风险分类中的表现显著优于传统统计模型,为多基因风险分析提供了新的工具。 2. 跨种族验证:研究在亚洲和欧洲人群中验证了多基因风险模型的有效性,表明其在跨种族应用中的潜力。 3. 疾病机制探索:通过无监督聚类和生物学通路分析,研究揭示了多基因风险与免疫相关通路的关联,为AD的病理机制研究提供了新的视角。

其他有价值的内容
研究还开发了一种基于图神经网络(Graph Neural Network, GNN)的多基因风险模型,通过整合遗传变异的生物学功能和连锁不平衡(Linkage Disequilibrium, LD)信息,进一步提高了模型的分类性能。这一方法为多基因风险分析的未来发展提供了新的方向。


这篇研究不仅为AD风险预测提供了新的技术手段,还为多基因疾病的机制研究开辟了新的途径,具有重要的科学和应用价值。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com