分享自:

非靶向代谢组学中AcquireX和Compound Discoverer 3.3软件的评估

期刊:scientific reportsDOI:10.1038/s41598-024-55356-3

本研究由美国农业部农业研究局(USDA-ARS)的Bret Cooper与Ronghui Yang合作完成,发表于2024年的《Scientific Reports》期刊,标题为《An assessment of AcquireX and Compound Discoverer software 3.3 for non‑targeted metabolomics》。研究聚焦于非靶向代谢组学(non-targeted metabolomics)领域,旨在评估Thermo Scientific Orbitrap Exploris 240质谱仪配套的AcquireX和Compound Discoverer 3.3(CD3.3)软件在酵母代谢物鉴定中的性能与局限性。

学术背景

代谢组学作为后基因组时代的重要研究工具,通过分析小分子代谢物(small molecules)的动态变化揭示生物系统的功能状态。然而,与基因组学和蛋白质组学相比,代谢组学缺乏标准化的准确性评估指标,且代谢物的结构多样性和动态范围使其鉴定面临挑战。本研究以酿酒酵母(Saccharomyces cerevisiae)BY4741菌株为模型,通过高分辨率质谱技术结合软件分析,探索提高化合物检测数量和鉴定准确性的方法。研究目标包括:(1)评估AcquireX软件通过多轮MS2采集提升可鉴定化合物数量的能力;(2)验证CD3.3软件基于MS2谱库匹配的化合物鉴定准确性;(3)揭示软件分析中潜在的误差来源及其对研究结论的影响。

研究流程

1. 酵母代谢物提取

研究采用极性(甲醇/水)和非极性(氯仿/甲醇)溶剂分步提取酵母代谢物。样本包括6个生物学重复的酵母培养物和2个基质空白对照。细胞破碎使用珠磨法(bead mill),提取液经真空干燥后复溶于特定溶剂,用于后续质谱分析。

2. 质谱数据采集

使用Orbitrap Exploris 240质谱仪,分别在正离子和负离子模式下采集数据。关键创新点在于AcquireX软件的迭代MS2采集策略:
- 离子排除列表生成:通过基质空白样本建立背景离子排除列表。
- 离子纳入列表优化:利用QC样本(pooled biological samples)生成目标离子列表。
- 六轮MS2采集:每轮采集后,已分析的离子自动加入排除列表,后续轮次聚焦于低丰度离子。质谱参数包括:分辨率120,000(MS1)和30,000(MS2),质量精度 ppm,动态排除窗口1.0 Da。

3. 数据分析流程

CD3.3软件处理流程包括:
- 色谱对齐与峰检测:采用2 ppm质量容差和0.25分钟保留时间(retention time, RT)容差。
- 背景过滤与标准化:使用SERRF算法(QC-based normalization)和空白样本过滤背景信号。
- 化合物鉴定:比对NIST_2020_MSMS、mzCloud及自定义氨基酸标准库(20种氨基酸),匹配阈值设定为70分(满分100)。
- 人工验证:针对高分匹配化合物检查母离子质量偏差、RT一致性及碎片离子合理性。

主要结果

  1. AcquireX提升检测深度:六轮MS2采集使可鉴定化合物数量增加50%,其中前两轮贡献84%的MS2谱图,后四轮主要捕获低丰度离子(图2)。
  2. 化合物鉴定数量与误差
    • 极性组分在负离子模式下检测到更多MS1离子(23,843个),但正离子模式鉴定出更多高置信度化合物(图3a)。
    • 最终非冗余鉴定结果为483种化合物,包括17种酵母内源氨基酸。
  3. 软件局限性案例
    • 错误匹配:例如,母离子m/z 156.0768的MS2谱匹配到质量偏差113 Da的乙酰肌肽(acetylcarnosine)(图6a),实际应为组氨酸(histidine)。
    • 同分异构体混淆:亮氨酸(leucine)和异亮氨酸(isoleucine)因RT接近被合并为一个峰(图8a)。
    • 离子变体干扰:丝氨酸(serine)因[m+ACN+H]+离子信号过强被标准化过滤(图9a)。

结论与意义

本研究证实AcquireX能有效扩展代谢物检测覆盖度,但CD3.3的鉴定结果需结合人工验证以规避以下问题:(1)谱库匹配分数与真实准确性不完全一致;(2)同分异构体和共洗脱化合物难以区分;(3)离子变体(如加合物)可能导致假阴性。科学价值在于为代谢组学研究提供了软件使用的最佳实践框架,强调多维度验证的必要性。应用价值体现在为医学、环境科学和农业领域的代谢组学平台选择与数据分析提供基准参考。

研究亮点

  1. 方法学创新:首次系统评估AcquireX多轮MS2采集策略对代谢物检测效率的提升。
  2. 误差系统性分析:揭示软件算法在母离子匹配、RT对齐及谱库搜索中的潜在误差机制。
  3. 跨领域适用性:研究结论可推广至其他采用高分辨率质谱的非靶向代谢组学场景。

其他价值

数据已公开于MassIVE(MSV000092514),支持后续研究复用。作者建议未来开发集成化工具以自动估算假阳性率(false discovery rate, FDR),并呼吁代谢组学社区建立更完备的参考谱库。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com