通过代谢组学鉴定独立肌萎缩侧索硬化队列中共享的脂质通路

分享自：
通过代谢组学鉴定独立肌萎缩侧索硬化队列中共享的脂质通路

医学
神经科学与心理学
神经系统
生物物理及生物化学
生命科学
期刊:brainDOI:10.1093/brain/awac025
【点击此处】阅读全文、收藏及针对性提问
一项关于肌萎缩侧索硬化症脂质代谢组学的重要研究
该研究由美国密歇根大学（University of Michigan）的 Stephen A. Goutman、Kai Guo、Masha G. Savelieff（这三位作者贡献同等）、Adam Patterson、Stacey A. Sakowski、Hani Habra、Alla Karnovsky、Junguk Hur 以及通讯作者 Eva L. Feldman 教授（来自密歇根大学神经内科和神经治疗网络）共同完成。研究成果于2022年1月28日在线发表，并最终正式刊载于神经科学领域的顶级期刊《Brain》（脑）2022年第145卷第12期（第4425-4439页）。这篇论文题为“代谢组学在独立的肌萎缩侧索硬化症队列中识别出共享的脂质通路”。
学术背景与研究目的
肌萎缩侧索硬化症（Amyotrophic Lateral Sclerosis, ALS）是一种致命的、进行性运动神经元疾病，目前缺乏有效的治疗方法。其病理生理机制复杂且尚未完全阐明，涉及遗传、表观遗传和环境因素的共同作用。代谢组（metabolome）是生物体内所有小分子代谢产物的集合，它整合了基因组、转录组、蛋白质组以及环境暴露的最终影响。因此，非靶向代谢组学（untargeted metabolomics）被认为是研究像ALS这类复杂疾病的强大工具，能够揭示病理过程中的代谢失调，从而为潜在的生物标志物和治疗靶点提供线索。
尽管已有少量研究利用代谢组学探索了ALS患者血液或脑脊液中的代谢变化，但这些研究存在一定局限性：一是检测的代谢物数量相对有限（约400种或更少），二是缺乏独立队列的验证（即复制研究），这使得研究结果的稳健性和普适性受到挑战。在此背景下，本研究团队的目标非常明确：首先，在他们先前发表的首个ALS队列（队列1）研究的基础上，引入一个新的、独立的复制队列（队列2），使用相同的商业代谢组学平台进行检测，以识别在两个队列中反复出现的、失调的代谢通路，这有助于区分普适性机制与偶然发现。其次，他们旨在评估利用代谢组学数据构建疾病预测模型的可行性。最后，他们还采用了不依赖先验通路知识的、数据驱动的差异网络富集分析（Differential Network Enrichment Analysis, DNeA）方法，在合并两个队列数据后，从整体代谢网络的角度揭示ALS的代谢失调模式。
详细的研究流程
本研究是一项横断面（cross-sectional）观察性研究，其核心流程可分为四个主要阶段：参与者招募与样本收集、代谢组学分析、统计与生物信息学分析、以及数据驱动网络分析。
第一阶段：研究对象与样本采集。 研究纳入了两个独立的参与者群体。队列1（原始队列） 包含125名ALS患者和71名健康对照者。队列2（复制队列） 包含225名ALS患者和104名健康对照者。所有参与者均来自密歇根大学Pranger ALS诊所及相关研究机构。研究人员收集了参与者的人口统计学信息（年龄、性别、身高、体重）、临床特征（如ALS功能评定量表修订版得分，ALSFRS-R）以及非空腹状态下的血浆样本。选择非空腹样本是出于对ALS患者的人道主义考虑，但已有研究表明血浆脂质组谱受饮食影响较小，且疾病相关的深层代谢特征独立于饮食状态存在。所有血浆样本按照标准操作程序处理，离心分装后储存于-80°C直至分析。
第二阶段：非靶向代谢组学检测。 血浆样本的代谢组学分析由Metabolon公司（美国北卡罗来纳州）完成。该平台采用超高效液相色谱-串联质谱（Ultra-high Performance Liquid Chromatography-Tandem Mass Spectroscopy, UPLC-MS/MS）技术，能够同时检测数千种化合物。分析过程包括：样品提取（使用甲醇）、反向相和亲水作用色谱分析（分别在正负离子模式下进行）、以及与已知标准品数据库比对以鉴定代谢物。为了保证数据质量，研究设置了严格的数据纳入标准：仅在超过80%的样本中检测到的代谢物（缺失率<20%）才被用于下游分析。经过筛选，队列1有793种代谢物，队列2有703种代谢物进入最终分析。此阶段的关键在于使用了高通量、广覆盖的商业平台，以及统一的、严格的质控流程，确保了两个队列数据的可比性。
第三阶段：差异代谢物与通路富集分析。 这是研究的核心分析部分，采用了多种统计和机器学习方法来识别ALS与对照之间的代谢差异，以提高结果的稳健性。具体方法如下： 1. 单变量分析： 使用Wilcoxon秩和检验（未调整模型）和逻辑回归（调整了年龄、性别、BMI的模型）来评估单个代谢物的差异。p值经过Benjamini–Hochberg方法校正。 2. 多变量分析： 采用偏最小二乘判别分析（Partial Least Squares-Discriminant Analysis, PLS-DA）。该方法用于可视化病例与对照的分离情况，并计算变量重要性投影（Variable Importance in Projection, VIP）得分。VIP > 1的代谢物被认为对组间分离有重要贡献。 3. 基于通路结构的分析： 使用组套索（Group Lasso） 回归（同样调整了年龄、性别、BMI）。这种方法将属于同一代谢子通路的代谢物视为一个组进行变量选择，有助于在子通路水平识别差异。 4. 通路富集分析： 对上述每种方法筛选出的差异代谢物集合，使用R包RITChR进行代谢通路富集分析。通过超几何检验，找出在ALS中过度富集的代谢子通路（p < 0.05为显著）。 5. 性别敏感性分析： 鉴于队列2的对照组中女性比例过高（68%），且性别是ALS的重要影响因素，研究额外进行了分层分析。将两个队列的数据分别按性别（男/女）拆分，重复上述Wilcoxon、逻辑回归、PLS-DA和组套索分析，以探讨代谢差异是否存在性别特异性。 6. 临床相关性分析： 研究者选取了两个队列共有的前20个差异代谢物，绘制了它们相对丰度随ALSFRS-R评分（从高到低，即疾病从轻到重）变化的热图，以探索代谢物水平与疾病严重程度的相关性。 7. 预测模型构建： 利用队列1的数据，训练了PLS-DA、组套索和随机森林（Random Forest, RF） 三种机器学习分类模型。然后将训练好的模型应用于队列2的数据，通过计算受试者工作特征曲线下面积（Area Under the Curve, AUC）来评估模型预测ALS病例的准确性和泛化能力。
第四阶段：差异网络富集分析（DNeA）。 这是一个不依赖于已知代谢通路注释的数据驱动方法。研究者首先将两个队列的数据合并，并调整了年龄、性别、BMI的潜在影响，通过标准化消除了批次效应。然后，基于联合样本数据，DNeA算法计算了在ALS组和对照组中代谢物之间的部分相关网络。该算法通过子采样和网络聚类，将高度相关的代谢物分组形成功能“子网络”。接着，利用NetGSA方法评估每个子网络在两组间的差异显著性，同时考虑代谢物丰度的差异和网络结构（代谢物间关联性）的差异。这种方法能够发现传统通路分析可能遗漏的、新的代谢物功能模块或相互作用。
主要研究成果
研究取得了多个层面的重要发现，结果之间环环相扣，共同指向了脂质代谢在ALS中的核心地位。
1. 队列基本特征与代谢物筛选结果： 两个ALS队列的临床特征具有代表性，与典型ALS人群相符。通过多种分析方法，在两个独立队列中均鉴定出了大量差异代谢物。虽然各方法筛选出的具体代谢物名单不完全重叠，但存在相当数量的共享代谢物（例如，Wilcoxon检验发现167个共享差异代谢物）。更重要的是，共享的差异代谢物其丰度与患者临床状态（ALSFRS-R评分）相关。热图显示，随着ALSFRS-R评分降低（病情加重），这20个共享代谢物的总体水平呈下降趋势，其中包括几种鞘磷脂（sphingomyelin）物种和酰基肉碱。这表明代谢组学特征不仅与疾病状态相关，还可能在一定程度上反映疾病的进展。
2. 预测模型验证了代谢组学的应用潜力： 使用队列1数据构建的三个预测模型（PLS-DA、组套索、随机森林）在独立的队列2数据上均表现出优秀的预测性能，AUC值分别高达0.944、0.945和0.903。这表明基于血浆代谢组学数据区分ALS患者与健康人是可行的，为未来开发ALS的代谢生物标志物提供了强有力的概念验证。值得注意的是，肌酸和肌酐在所有模型中都贡献显著，但这很可能反映了疾病导致的肌肉消耗，而非特异性病因。
3. 通路富集分析揭示了以脂质为中心的核心失调通路： 这是本研究最关键的发现。尽管单个代谢物列表有差异，但通路层面的分析显示出高度的一致性。在两个队列中，被多种分析方法反复富集到的代谢子通路强烈集中在脂质代谢领域。具体包括： * 脂肪酸及其代谢中间体： “长链饱和脂肪酸”、“长链多不饱和脂肪酸（n3和n6）”、“长链单不饱和脂肪酸”、“脂肪酸代谢（多不饱和酰基肉碱）”。这些代谢物在ALS患者血浆中普遍升高。 * 复杂鞘脂： “鞘磷脂（sphingomyelins）”。这是组套索分析在队列1中识别出的最显著的子通路，在队列2中也得到其他方法确认。 * 其他能量相关代谢： “肌酸”和“黄嘌呤”代谢也重复出现。
此外，研究还发现了一些具有队列或性别特异性的通路，如“神经酰胺”、“己糖基神经酰胺”在队列1中更突出，而“鞘氨醇”、“TCA循环”在队列2中更明显。性别敏感性分析进一步揭示，某些脂质通路（如长链脂肪酸、二酰基甘油、鞘氨醇）在女性ALS患者中富集更显著，而“鞘磷脂”和“苯甲酸盐代谢”则在男性中更突出。这些发现提示，代谢失调模式可能存在性别差异，这可能部分解释了ALS发病率的性别差异（男性更高），也为个性化治疗提供了线索。
4. DNeA分析从网络视角整合并证实了代谢失调的复杂性： 合并数据分析后，DNeA识别出了9个在ALS与对照组间存在显著差异的代谢子网络（FDR < 0.01）。其中三个子网络（S3， S8， S9）明确以脂质物种为核心： * 子网络S8： 主要包含显著升高的鞘磷脂、二氢鞘磷脂、神经酰胺和己糖基神经酰胺。这直接印证并强化了通路富集分析的结果，将多种相关的鞘脂类聚集在一个功能模块中，提示鞘脂代谢网络在ALS中发生了整体性紊乱。 * 子网络S9： 包含多种复杂磷脂（如磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰肌醇）和信号脂质（如二酰基甘油）。其中许多磷脂类物质水平下降，而二酰基甘油普遍升高。这提示ALS中可能存在膜脂组成改变和脂质信号传导异常。 * 子网络S3： 主要由各种游离长链脂肪酸组成，它们在ALS中普遍显著升高。 * 子网络S5和S7： 则汇聚了来自不同超级通路的代谢物，包括TCA循环、氨基酸代谢、抗氧化剂、嘌呤/嘧啶和异生素代谢等，反映了ALS代谢失调的广泛性和系统性。
结论与意义
本研究的结论清晰而有力：通过对两个大规模独立ALS队列的血浆非靶向代谢组学分析，研究者发现了一组在ALS患者中反复出现、且高度一致的代谢失调通路，这些通路的核心是脂质代谢。具体涉及脂肪酸代谢（β-氧化）异常、鞘脂代谢紊乱以及复杂磷脂代谢和脂质信号传导的改变。这些发现进一步支持了脂质代谢通路作为ALS重要病理机制和治疗靶点的地位。
研究的科学价值体现在多个方面： 1. 首次提供了ALS代谢组学的复制研究证据，极大地增强了此前发现的可靠性和普适性，减少了假阳性结果的可能性。 2. 系统性地整合了多种分析方法（从单变量到多变量，从知识驱动到数据驱动），从不同维度全面描绘了ALS的代谢图谱，结论更为扎实。 3. 揭示了代谢失调的性别差异，为理解ALS的性别二态性提供了新的代谢视角。 4. 成功构建并验证了高精度的疾病预测模型，证明了代谢组学应用于ALS生物标志物开发的巨大潜力。 5. 应用了前沿的DNeA分析方法，突破了传统通路知识的限制，从代谢网络的整体关联中发现了新的功能模块。
其应用价值在于为未来的转化研究指明了方向：靶向脂质代谢（如调节鞘脂合成、改善脂肪酸β-氧化、平衡脂质信号）可能成为开发ALS新疗法的有前景的策略。同时，研究中识别出的特定脂质物种或模式，有潜力被进一步开发为辅助诊断或监测疾病进展的生物标志物。
研究亮点
研究的创新性与严谨性： 这是首个在ALS领域进行的、使用相同高通量平台的大规模代谢组学复制研究，设计严谨，样本量充足，显著提升了研究发现的可靠性。
核心发现的突出性： 明确地将脂质代谢通路（特别是鞘脂和脂肪酸代谢）置于ALS病理机制的中心位置，这一发现在两个独立队列中得到反复验证。
分析方法的先进性与综合性： 不仅使用了常规统计方法，还引入了组套索回归和数据驱动的差异网络富集分析（DNeA），后者能够无偏地发现新的代谢物功能关联，是方法论上的一个亮点。
关注临床转化与异质性： 进行了预测模型构建和性别分层分析，不仅探索了代谢组学的诊断应用前景，还深入挖掘了疾病内部的异质性（性别差异），使研究更具临床相关性。
多维度结果相互印证： 单个代谢物差异、通路富集、网络模块分析以及临床相关性分析的结果相互支撑，共同构建了一个关于ALS代谢失调的连贯且多层次的科学叙事。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问