本研究由美国农业部农业研究局(USDA-ARS)的Bret Cooper与Ronghui Yang合作完成,发表于2024年的《Scientific Reports》期刊,标题为《An assessment of AcquireX and Compound Discoverer software 3.3 for non‑targeted metabolomics》。研究聚焦于非靶向代谢组学(non-targeted metabolomics)领域,旨在评估Thermo Scientific Orbitrap Exploris 240质谱仪配套的AcquireX和Compound Discoverer 3.3(CD3.3)软件在酵母代谢物鉴定中的性能与局限性。
代谢组学作为后基因组时代的重要研究工具,通过分析小分子代谢物(small molecules)的动态变化揭示生物系统的功能状态。然而,与基因组学和蛋白质组学相比,代谢组学缺乏标准化的准确性评估指标,且代谢物的结构多样性和动态范围使其鉴定面临挑战。本研究以酿酒酵母(Saccharomyces cerevisiae)BY4741菌株为模型,通过高分辨率质谱技术结合软件分析,探索提高化合物检测数量和鉴定准确性的方法。研究目标包括:(1)评估AcquireX软件通过多轮MS2采集提升可鉴定化合物数量的能力;(2)验证CD3.3软件基于MS2谱库匹配的化合物鉴定准确性;(3)揭示软件分析中潜在的误差来源及其对研究结论的影响。
研究采用极性(甲醇/水)和非极性(氯仿/甲醇)溶剂分步提取酵母代谢物。样本包括6个生物学重复的酵母培养物和2个基质空白对照。细胞破碎使用珠磨法(bead mill),提取液经真空干燥后复溶于特定溶剂,用于后续质谱分析。
使用Orbitrap Exploris 240质谱仪,分别在正离子和负离子模式下采集数据。关键创新点在于AcquireX软件的迭代MS2采集策略:
- 离子排除列表生成:通过基质空白样本建立背景离子排除列表。
- 离子纳入列表优化:利用QC样本(pooled biological samples)生成目标离子列表。
- 六轮MS2采集:每轮采集后,已分析的离子自动加入排除列表,后续轮次聚焦于低丰度离子。质谱参数包括:分辨率120,000(MS1)和30,000(MS2),质量精度 ppm,动态排除窗口1.0 Da。
CD3.3软件处理流程包括:
- 色谱对齐与峰检测:采用2 ppm质量容差和0.25分钟保留时间(retention time, RT)容差。
- 背景过滤与标准化:使用SERRF算法(QC-based normalization)和空白样本过滤背景信号。
- 化合物鉴定:比对NIST_2020_MSMS、mzCloud及自定义氨基酸标准库(20种氨基酸),匹配阈值设定为70分(满分100)。
- 人工验证:针对高分匹配化合物检查母离子质量偏差、RT一致性及碎片离子合理性。
本研究证实AcquireX能有效扩展代谢物检测覆盖度,但CD3.3的鉴定结果需结合人工验证以规避以下问题:(1)谱库匹配分数与真实准确性不完全一致;(2)同分异构体和共洗脱化合物难以区分;(3)离子变体(如加合物)可能导致假阴性。科学价值在于为代谢组学研究提供了软件使用的最佳实践框架,强调多维度验证的必要性。应用价值体现在为医学、环境科学和农业领域的代谢组学平台选择与数据分析提供基准参考。
数据已公开于MassIVE(MSV000092514),支持后续研究复用。作者建议未来开发集成化工具以自动估算假阳性率(false discovery rate, FDR),并呼吁代谢组学社区建立更完备的参考谱库。