本文为您介绍一项发表于期刊*Atherosclerosis*,在线发表日期为2025年11月1日,题为《探索线粒体基因与颈动脉斑块的因果生物学关联:一项多组学孟德尔随机化研究》的研究。该研究由来自中国吉林大学第一医院神经血管外科(第一作者:Zhuyuan Yu)与吉林大学公共卫生学院毒理学系(共同第一作者:Xiangyuan Meng)的研究团队合作完成,通讯作者为吉林大学的Hao Chen。
一、 研究背景与目的
颈动脉斑块是颈部血管粥样硬化的标志性表现,是导致脑卒中、冠心病等心脑血管事件的关键病理基础。据统计,全球成年人群中颈动脉斑块患病率约为21.1%,在中国成年人中亦高达21%。因此,深入探究颈动脉斑块发生发展的机制并寻找有效的干预靶点,对降低心脑血管疾病负担具有重要意义。
近年来,线粒体功能障碍被认为是动脉粥样硬化发生发展的核心生物学因素之一。线粒体是细胞的能量工厂,其功能障碍会引发氧化应激、炎症反应加剧、细胞代谢异常等一系列病理过程,从而驱动血管平滑肌细胞向泡沫细胞转化、巨噬细胞向促炎表型极化,最终促进脂质沉积和斑块形成。然而,现有研究存在两个主要局限:第一,多为观察性或实验性研究,难以完全排除反向因果关系和混杂因素干扰,因果推断证据有限;第二,缺乏多组学层面的整合分析,大多数研究仅关注单一分子层面(如基因表达或蛋白质水平),未能系统揭示DNA甲基化、基因表达和蛋白质丰度之间的相互调控关系及其在疾病中的作用。
为克服上述局限,本研究采用了基于遗传变异的孟德尔随机化分析方法。孟德尔随机化利用与暴露因素(如基因甲基化水平、表达水平)强相关的遗传变异作为工具变量,来推断暴露与结局(颈动脉斑块)之间的因果关联。由于其遗传变异在受孕时随机分配,不受后天环境和疾病状态影响,该方法能有效避免传统观察性研究的混杂和反向因果偏倚。本研究创新性地整合了来自多个大型队列的甲基化数量性状位点、表达数量性状位点、蛋白质数量性状位点以及线粒体DNA拷贝数数据,旨在通过多组学联合分析与证据分级,首次系统地评估线粒体相关基因与颈动脉斑块之间的因果关联,为揭示颈动脉斑块的分子机制和发现潜在的治疗靶点提供全新的遗传学证据。
二、 研究方法与详细流程
本研究是一项综合性的遗传学分析,其核心分析框架如下图所示(流程示意图基于原文Fig.1描述),主要包括数据获取、因果推断、敏感性分析、共定位分析和多组学证据整合五个主要环节。
第一环节:数据来源与工具变量选择。 研究团队首先从MitoCarta3.0数据库中获取了1136个人类线粒体相关基因列表。随后,从多个公开的大型全基因组关联研究汇总统计数据中提取工具变量: 1. 甲基化数据: 来自McRae等人的研究,包含1980名欧洲血统个体血液样本的SNP-CpG位点关联数据。 2. 基因表达数据: 来自eQTLGen联盟,包含31,684名个体的血液表达数量性状位点数据。 3. 蛋白质丰度数据: 来自两个队列:英国生物银行蛋白质组学计划(54,219人)和Egil Ferkingstad等人的冰岛人群研究(35,559人)。 4. 线粒体DNA拷贝数数据: 来自IEU OpenGWAS项目,样本量为383,476人。 5. 颈动脉斑块结局数据: 来自GWAS目录数据库,包含21,540例病例和26,894例对照。
所有数据均源于欧洲人群,以确保人群同质性,减少群体分层偏倚。研究聚焦于顺式作用位点,即位于基因转录起始或终止位点上下游1 Mb范围内的遗传变异,这些变异通常直接调控邻近基因的分子表型。工具变量的筛选严格遵循孟德尔随机化的三个核心假设(相关性、独立性、排他性),选取全基因组显著性水平达到p < 5×10⁻⁸的单核苷酸多态性,并设置了连锁不平衡参数(r² < 0.3,距离500 kb)和最小等位基因频率(MAF > 0.01)以确保独立性。同时,排除了与已知混杂因素及结局直接相关的SNP。
第二环节:因果效应估计与SMR分析。 本研究主要采用两样本孟德尔随机化进行因果推断,并辅以基于汇总数据的孟德尔随机化分析以增强统计效力。 1. 孟德尔随机化分析: 使用逆方差加权法作为主要分析方法,并辅以MR-Egger回归、加权中位数法、加权模型和简单模型进行验证。所有分析均通过R语言中的“TwoSampleMR”包实现。对于每个基因或分子表型(CpG位点甲基化、基因表达、蛋白质水平),利用其对应的cis-QTLs作为工具变量,估计其与颈动脉斑块风险的因果效应比值比。 2. SMR与HEIDI分析: 使用SMR软件对cis区域的顶级信号进行分析。该方法利用最显著的cis-QTL进行关联检验,其统计效力通常高于传统MR。同时,通过HEIDI检验来评估是否存在由于连锁不平衡或水平多效性导致的虚假关联,将p_HEIDI < 0.01的结果视为可能存在多效性而予以排除。
第三环节:敏感性分析与方向性检验。 为确保结果的稳健性,研究进行了全面的敏感性分析: 1. 异质性检验: 采用Cochran‘s Q检验评估不同工具变量之间的异质性,并使用I²统计量量化异质性程度。 2. 水平多效性检验: 通过MR-Egger回归的截距项和MR-PRESSO全局检验来评估工具变量是否存在不通过暴露直接影响结局的水平多效性。 3. 留一法分析: 逐一剔除每个SNP后重新进行MR分析,以检验单个强影响SNP是否主导了因果效应估计。 4. Steiger过滤检验: 检验因果方向是否符合预期(即基因型→分子表型→颈动脉斑块),确认推断的因果方向具有生物学合理性。
第四环节:共定位分析。 使用R包“coloc”对每个候选基因所在区域(±1000 kb)进行分析,评估颈动脉斑块的GWAS信号与分子QTL信号是否由同一个因果变异驱动。通过计算后验概率,判断是共享因果变异(假设H4, PP.H4 > 0.5为强证据)还是由不同的变异独立驱动。
第五环节:多组学证据整合与分级。 这是本研究的创新性关键步骤。研究团队建立了一个三级证据分级框架,对在甲基化、基因表达和蛋白质三个层面均通过MR和SMR分析的基因进行整合与分级: - 第一级证据: 在甲基化、基因表达和蛋白质三个层面均显示出一致的、显著的因果关联,且关联方向在生物学上协调。 - 第二级证据: 在任意两个分子层面显示出一致的、显著的因果关联。 - 第三级证据: 在一个分子层面显示出显著因果关联,并得到共定位分析(PP.H4 > 0.5)的进一步支持。
第六环节:系统生物学分析。 对最终筛选出的候选基因集,研究者进行了蛋白-蛋白互作网络分析、基因本体功能富集分析和京都基因与基因组百科全书通路富集分析,以探索这些基因在生物学通路和功能模块中的潜在协同作用。
三、 主要研究结果
经过严格的数据过滤和分析流程,本研究获得了以下关键发现:
1. 单组学层面因果关联识别: - 甲基化层面: 通过cis-mQTLs分析,初步发现208个基因的437个CpG位点与颈动脉斑块相关。经敏感性分析和HEIDI检验后,最终有42个基因的67个CpG位点通过SMR检验。值得注意的是,同一基因内不同CpG位点的甲基化对斑块风险的影响方向可能相反,例如AGXT基因的某些位点甲基化升高降低风险,而另一些位点则增加风险。 - 基因表达层面: 通过cis-eQTLs分析,发现212个线粒体基因的表达水平与颈动脉斑块风险显著相关(98个负相关,114个正相关)。SMR分析进一步确定了37个基因存在因果关联。 - 蛋白质层面: 通过整合两个独立的pQTL数据集,MR分析发现43个线粒体相关血浆蛋白水平与颈动脉斑块风险相关(20个负相关,23个正相关)。SMR分析确认了其中12个蛋白的因果关联。例如,肌酸激酶线粒体2型蛋白水平与斑块风险呈强正相关。 - 线粒体DNA拷贝数: MR分析未发现线粒体DNA拷贝数与颈动脉斑块风险之间存在显著的因果关联。
2. 多组学证据整合与核心发现: 通过对三个分子层面结果进行整合与分级,研究共确定了16个与颈动脉斑块存在多组学证据关联的线粒体基因: - 第一级基因(1个):甘氨酸脒基转移酶基因(GATM)。 这是本研究的核心发现。GATM在甲基化、基因表达和蛋白质三个层面均显示出高度一致的因果证据。具体表现为:GATM基因内cg10760299位点的甲基化水平升高,会降低GATM的基因表达,增加其蛋白质水平,并最终导致颈动脉斑块风险升高。这表明GATM的表达和功能受到表观遗传调控,并可能在斑块形成中扮演重要角色。 - 第二级基因(11个): 包括CBR4、PGS1、PTMPT1、SDSL、SLC25A28、SPRYD4、TARS2、ACAT1、GRHPR、METAP1D、NIT2。这些基因在任意两个分子层面(多为甲基化与表达,或表达与蛋白质)显示出显著且方向一致的因果关联。 - 第三级基因(4个): 包括ACSM2A、AGXT、TOP1MT、CKMT2。这些基因在一个层面(如甲基化)显示出显著关联,并得到共定位分析的有力支持。
3. 系统生物学分析结果: 对16个候选基因构建的PPI网络包含了63个蛋白节点和252条互作边,显示出这些蛋白在功能上紧密相连。GO和KEGG富集分析一致表明,这些基因显著富集于氨基酸代谢过程(如甘氨酸、丝氨酸和苏氨酸代谢)、维生素结合(尤其是维生素B6/磷酸吡哆醛结合)、以及线粒体基质等细胞组分。通路分析进一步突出了它们在碳代谢等核心代谢通路中的重要作用。这提示线粒体功能,特别是其介导的氨基酸和能量代谢紊乱,可能是连接这些基因与颈动脉斑块发病的共同生物学基础。
四、 研究结论与意义
本研究的核心结论是:通过整合多组学孟德尔随机化分析,首次系统性地鉴定出16个在遗传、甲基化及蛋白质水平上与颈动脉斑块发病存在因果关联的线粒体基因,其中GATM基因的证据最为充分。这表明线粒体功能障碍,尤其是涉及氨基酸代谢(如甘氨酸和肌酸代谢)、脂质代谢和氧化应激反应的基因网络紊乱,是颈动脉斑块发生发展的重要驱动因素。
科学价值: 1. 提供因果证据: 研究利用遗传工具变量,为线粒体基因与颈动脉斑块之间的关联提供了比观察性研究更强的因果推断证据,减少了混杂和反向因果的干扰。 2. 实现多组学整合: 创新性地将mQTL、eQTL、pQTL数据与MR方法结合,构建了从表观遗传调控到转录、再到翻译产物的完整因果链视角,深化了对疾病分子机制的理解。 3. 建立分级框架: 提出的多组学证据分级框架,为未来类似研究提供了可借鉴的分析范式,有助于从海量组学数据中 prioritise 出高置信度的候选基因。 4. 揭示新靶点: 明确指出了GATM、CKMT2、ACAT1等一批具有潜在研究价值的基因,为后续的功能实验和机制探索指明了方向。
应用与临床意义: 1. 潜在治疗靶点: GATM和CKMT2均与肌酸代谢通路相关。肌酸代谢异常与同型半胱氨酸水平升高(已知心血管风险因素)及他汀类药物相关肌病有关。这提示,调节肌酸代谢可能成为同时干预动脉粥样硬化进展和管理他汀副作用的新策略。 2. 生物标志物潜力: 研究中发现的在血浆中可检测的蛋白质(如CKMT2、GRHPR),可能作为预测颈动脉斑块风险或监测疾病进展的潜在循环生物标志物。 3. 深化病理认知: 研究将线粒体功能与颈动脉斑块的具体代谢通路(如草酸代谢、心磷脂生物合成)联系起来,为理解斑块发生发展的代谢重编程提供了新线索。
五、 研究亮点
六、 其他有价值的内容与研究局限
研究同时客观指出了其局限性: 1. 人群局限性: 所有数据均来自欧洲人群,结论在其他种族人群中的普适性有待验证。 2. 组织特异性: 使用的组学数据来源于血液或血浆,可能无法完全反映血管壁局部(特别是斑块部位)的分子变化特征。 3. 间接推断: MR分析本质上是基于遗传变异的间接因果推断,其有效性依赖于工具变量假设的成立。尽管进行了大量敏感性分析,但残留偏倚的可能性无法完全排除。 4. 功能机制待阐: 本研究主要提供了遗传学和生物信息学层面的证据,这些基因影响颈动脉斑块的具体细胞和分子机制,有待后续的细胞、动物实验及临床研究进一步验证。
研究者展望,未来结合单细胞测序、空间转录组学等新技术,在血管组织水平深入解析这些基因在斑块不同细胞类型中的作用,将有助于开发更精准的靶向治疗策略,通过保护线粒体健康来抑制炎症、稳定斑块,最终预防心脑血管事件的发生。