分享自:

通过代谢组学鉴定独立肌萎缩侧索硬化队列中共享的脂质通路

期刊:brainDOI:10.1093/brain/awac025

一项关于肌萎缩侧索硬化症脂质代谢组学的重要研究

该研究由美国密歇根大学(University of Michigan)的 Stephen A. Goutman、Kai Guo、Masha G. Savelieff(这三位作者贡献同等)、Adam Patterson、Stacey A. Sakowski、Hani Habra、Alla Karnovsky、Junguk Hur 以及通讯作者 Eva L. Feldman 教授(来自密歇根大学神经内科和神经治疗网络)共同完成。研究成果于2022年1月28日在线发表,并最终正式刊载于神经科学领域的顶级期刊《Brain》(脑)2022年第145卷第12期(第4425-4439页)。这篇论文题为“代谢组学在独立的肌萎缩侧索硬化症队列中识别出共享的脂质通路”。

学术背景与研究目的

肌萎缩侧索硬化症(Amyotrophic Lateral Sclerosis, ALS)是一种致命的、进行性运动神经元疾病,目前缺乏有效的治疗方法。其病理生理机制复杂且尚未完全阐明,涉及遗传、表观遗传和环境因素的共同作用。代谢组(metabolome)是生物体内所有小分子代谢产物的集合,它整合了基因组、转录组、蛋白质组以及环境暴露的最终影响。因此,非靶向代谢组学(untargeted metabolomics)被认为是研究像ALS这类复杂疾病的强大工具,能够揭示病理过程中的代谢失调,从而为潜在的生物标志物和治疗靶点提供线索。

尽管已有少量研究利用代谢组学探索了ALS患者血液或脑脊液中的代谢变化,但这些研究存在一定局限性:一是检测的代谢物数量相对有限(约400种或更少),二是缺乏独立队列的验证(即复制研究),这使得研究结果的稳健性和普适性受到挑战。在此背景下,本研究团队的目标非常明确:首先,在他们先前发表的首个ALS队列(队列1)研究的基础上,引入一个新的、独立的复制队列(队列2),使用相同的商业代谢组学平台进行检测,以识别在两个队列中反复出现的、失调的代谢通路,这有助于区分普适性机制与偶然发现。其次,他们旨在评估利用代谢组学数据构建疾病预测模型的可行性。最后,他们还采用了不依赖先验通路知识的、数据驱动的差异网络富集分析(Differential Network Enrichment Analysis, DNeA)方法,在合并两个队列数据后,从整体代谢网络的角度揭示ALS的代谢失调模式。

详细的研究流程

本研究是一项横断面(cross-sectional)观察性研究,其核心流程可分为四个主要阶段:参与者招募与样本收集、代谢组学分析、统计与生物信息学分析、以及数据驱动网络分析。

第一阶段:研究对象与样本采集。 研究纳入了两个独立的参与者群体。队列1(原始队列) 包含125名ALS患者和71名健康对照者。队列2(复制队列) 包含225名ALS患者和104名健康对照者。所有参与者均来自密歇根大学Pranger ALS诊所及相关研究机构。研究人员收集了参与者的人口统计学信息(年龄、性别、身高、体重)、临床特征(如ALS功能评定量表修订版得分,ALSFRS-R)以及非空腹状态下的血浆样本。选择非空腹样本是出于对ALS患者的人道主义考虑,但已有研究表明血浆脂质组谱受饮食影响较小,且疾病相关的深层代谢特征独立于饮食状态存在。所有血浆样本按照标准操作程序处理,离心分装后储存于-80°C直至分析。

第二阶段:非靶向代谢组学检测。 血浆样本的代谢组学分析由Metabolon公司(美国北卡罗来纳州)完成。该平台采用超高效液相色谱-串联质谱(Ultra-high Performance Liquid Chromatography-Tandem Mass Spectroscopy, UPLC-MS/MS)技术,能够同时检测数千种化合物。分析过程包括:样品提取(使用甲醇)、反向相和亲水作用色谱分析(分别在正负离子模式下进行)、以及与已知标准品数据库比对以鉴定代谢物。为了保证数据质量,研究设置了严格的数据纳入标准:仅在超过80%的样本中检测到的代谢物(缺失率<20%)才被用于下游分析。经过筛选,队列1有793种代谢物,队列2有703种代谢物进入最终分析。此阶段的关键在于使用了高通量、广覆盖的商业平台,以及统一的、严格的质控流程,确保了两个队列数据的可比性。

第三阶段:差异代谢物与通路富集分析。 这是研究的核心分析部分,采用了多种统计和机器学习方法来识别ALS与对照之间的代谢差异,以提高结果的稳健性。具体方法如下: 1. 单变量分析: 使用Wilcoxon秩和检验(未调整模型)和逻辑回归(调整了年龄、性别、BMI的模型)来评估单个代谢物的差异。p值经过Benjamini–Hochberg方法校正。 2. 多变量分析: 采用偏最小二乘判别分析(Partial Least Squares-Discriminant Analysis, PLS-DA)。该方法用于可视化病例与对照的分离情况,并计算变量重要性投影(Variable Importance in Projection, VIP)得分。VIP > 1的代谢物被认为对组间分离有重要贡献。 3. 基于通路结构的分析: 使用组套索(Group Lasso) 回归(同样调整了年龄、性别、BMI)。这种方法将属于同一代谢子通路的代谢物视为一个组进行变量选择,有助于在子通路水平识别差异。 4. 通路富集分析: 对上述每种方法筛选出的差异代谢物集合,使用R包RITChR进行代谢通路富集分析。通过超几何检验,找出在ALS中过度富集的代谢子通路(p < 0.05为显著)。 5. 性别敏感性分析: 鉴于队列2的对照组中女性比例过高(68%),且性别是ALS的重要影响因素,研究额外进行了分层分析。将两个队列的数据分别按性别(男/女)拆分,重复上述Wilcoxon、逻辑回归、PLS-DA和组套索分析,以探讨代谢差异是否存在性别特异性。 6. 临床相关性分析: 研究者选取了两个队列共有的前20个差异代谢物,绘制了它们相对丰度随ALSFRS-R评分(从高到低,即疾病从轻到重)变化的热图,以探索代谢物水平与疾病严重程度的相关性。 7. 预测模型构建: 利用队列1的数据,训练了PLS-DA、组套索和随机森林(Random Forest, RF) 三种机器学习分类模型。然后将训练好的模型应用于队列2的数据,通过计算受试者工作特征曲线下面积(Area Under the Curve, AUC)来评估模型预测ALS病例的准确性和泛化能力。

第四阶段:差异网络富集分析(DNeA)。 这是一个不依赖于已知代谢通路注释的数据驱动方法。研究者首先将两个队列的数据合并,并调整了年龄、性别、BMI的潜在影响,通过标准化消除了批次效应。然后,基于联合样本数据,DNeA算法计算了在ALS组和对照组中代谢物之间的部分相关网络。该算法通过子采样和网络聚类,将高度相关的代谢物分组形成功能“子网络”。接着,利用NetGSA方法评估每个子网络在两组间的差异显著性,同时考虑代谢物丰度的差异和网络结构(代谢物间关联性)的差异。这种方法能够发现传统通路分析可能遗漏的、新的代谢物功能模块或相互作用。

主要研究成果

研究取得了多个层面的重要发现,结果之间环环相扣,共同指向了脂质代谢在ALS中的核心地位。

1. 队列基本特征与代谢物筛选结果: 两个ALS队列的临床特征具有代表性,与典型ALS人群相符。通过多种分析方法,在两个独立队列中均鉴定出了大量差异代谢物。虽然各方法筛选出的具体代谢物名单不完全重叠,但存在相当数量的共享代谢物(例如,Wilcoxon检验发现167个共享差异代谢物)。更重要的是,共享的差异代谢物其丰度与患者临床状态(ALSFRS-R评分)相关。热图显示,随着ALSFRS-R评分降低(病情加重),这20个共享代谢物的总体水平呈下降趋势,其中包括几种鞘磷脂(sphingomyelin)物种和酰基肉碱。这表明代谢组学特征不仅与疾病状态相关,还可能在一定程度上反映疾病的进展。

2. 预测模型验证了代谢组学的应用潜力: 使用队列1数据构建的三个预测模型(PLS-DA、组套索、随机森林)在独立的队列2数据上均表现出优秀的预测性能,AUC值分别高达0.944、0.945和0.903。这表明基于血浆代谢组学数据区分ALS患者与健康人是可行的,为未来开发ALS的代谢生物标志物提供了强有力的概念验证。值得注意的是,肌酸和肌酐在所有模型中都贡献显著,但这很可能反映了疾病导致的肌肉消耗,而非特异性病因。

3. 通路富集分析揭示了以脂质为中心的核心失调通路: 这是本研究最关键的发现。尽管单个代谢物列表有差异,但通路层面的分析显示出高度的一致性。在两个队列中,被多种分析方法反复富集到的代谢子通路强烈集中在脂质代谢领域。具体包括: * 脂肪酸及其代谢中间体: “长链饱和脂肪酸”、“长链多不饱和脂肪酸(n3和n6)”、“长链单不饱和脂肪酸”、“脂肪酸代谢(多不饱和酰基肉碱)”。这些代谢物在ALS患者血浆中普遍升高。 * 复杂鞘脂: “鞘磷脂(sphingomyelins)”。这是组套索分析在队列1中识别出的最显著的子通路,在队列2中也得到其他方法确认。 * 其他能量相关代谢: “肌酸”和“黄嘌呤”代谢也重复出现。

此外,研究还发现了一些具有队列或性别特异性的通路,如“神经酰胺”、“己糖基神经酰胺”在队列1中更突出,而“鞘氨醇”、“TCA循环”在队列2中更明显。性别敏感性分析进一步揭示,某些脂质通路(如长链脂肪酸、二酰基甘油、鞘氨醇)在女性ALS患者中富集更显著,而“鞘磷脂”和“苯甲酸盐代谢”则在男性中更突出。这些发现提示,代谢失调模式可能存在性别差异,这可能部分解释了ALS发病率的性别差异(男性更高),也为个性化治疗提供了线索。

4. DNeA分析从网络视角整合并证实了代谢失调的复杂性: 合并数据分析后,DNeA识别出了9个在ALS与对照组间存在显著差异的代谢子网络(FDR < 0.01)。其中三个子网络(S3, S8, S9)明确以脂质物种为核心: * 子网络S8: 主要包含显著升高的鞘磷脂、二氢鞘磷脂、神经酰胺和己糖基神经酰胺。这直接印证并强化了通路富集分析的结果,将多种相关的鞘脂类聚集在一个功能模块中,提示鞘脂代谢网络在ALS中发生了整体性紊乱。 * 子网络S9: 包含多种复杂磷脂(如磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰肌醇)和信号脂质(如二酰基甘油)。其中许多磷脂类物质水平下降,而二酰基甘油普遍升高。这提示ALS中可能存在膜脂组成改变和脂质信号传导异常。 * 子网络S3: 主要由各种游离长链脂肪酸组成,它们在ALS中普遍显著升高。 * 子网络S5和S7: 则汇聚了来自不同超级通路的代谢物,包括TCA循环、氨基酸代谢、抗氧化剂、嘌呤/嘧啶和异生素代谢等,反映了ALS代谢失调的广泛性和系统性。

结论与意义

本研究的结论清晰而有力:通过对两个大规模独立ALS队列的血浆非靶向代谢组学分析,研究者发现了一组在ALS患者中反复出现、且高度一致的代谢失调通路,这些通路的核心是脂质代谢。具体涉及脂肪酸代谢(β-氧化)异常、鞘脂代谢紊乱以及复杂磷脂代谢和脂质信号传导的改变。这些发现进一步支持了脂质代谢通路作为ALS重要病理机制和治疗靶点的地位。

研究的科学价值体现在多个方面: 1. 首次提供了ALS代谢组学的复制研究证据,极大地增强了此前发现的可靠性和普适性,减少了假阳性结果的可能性。 2. 系统性地整合了多种分析方法(从单变量到多变量,从知识驱动到数据驱动),从不同维度全面描绘了ALS的代谢图谱,结论更为扎实。 3. 揭示了代谢失调的性别差异,为理解ALS的性别二态性提供了新的代谢视角。 4. 成功构建并验证了高精度的疾病预测模型,证明了代谢组学应用于ALS生物标志物开发的巨大潜力。 5. 应用了前沿的DNeA分析方法,突破了传统通路知识的限制,从代谢网络的整体关联中发现了新的功能模块。

其应用价值在于为未来的转化研究指明了方向:靶向脂质代谢(如调节鞘脂合成、改善脂肪酸β-氧化、平衡脂质信号)可能成为开发ALS新疗法的有前景的策略。同时,研究中识别出的特定脂质物种或模式,有潜力被进一步开发为辅助诊断或监测疾病进展的生物标志物。

研究亮点

  1. 研究的创新性与严谨性: 这是首个在ALS领域进行的、使用相同高通量平台的大规模代谢组学复制研究,设计严谨,样本量充足,显著提升了研究发现的可靠性。
  2. 核心发现的突出性: 明确地将脂质代谢通路(特别是鞘脂和脂肪酸代谢)置于ALS病理机制的中心位置,这一发现在两个独立队列中得到反复验证。
  3. 分析方法的先进性与综合性: 不仅使用了常规统计方法,还引入了组套索回归和数据驱动的差异网络富集分析(DNeA),后者能够无偏地发现新的代谢物功能关联,是方法论上的一个亮点。
  4. 关注临床转化与异质性: 进行了预测模型构建和性别分层分析,不仅探索了代谢组学的诊断应用前景,还深入挖掘了疾病内部的异质性(性别差异),使研究更具临床相关性。
  5. 多维度结果相互印证: 单个代谢物差异、通路富集、网络模块分析以及临床相关性分析的结果相互支撑,共同构建了一个关于ALS代谢失调的连贯且多层次的科学叙事。
上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com