这篇文档属于类型b,是一篇发表在nature methods(2023年2月,第20卷)上的综述性论文,题为《Guiding the Choice of Informatics Software and Tools for Lipidomics Research Applications》。作者团队由来自全球多个研究机构的学者组成,包括德国德累斯顿工业大学、英国卡迪夫大学、奥地利维也纳大学、瑞士生物信息学研究所等,通讯作者为Valerie B. O’Donnell和Maria Fedorova。
本文聚焦于脂质组学(lipidomics)研究中的信息学工具选择问题。脂质组学作为代谢组学的重要分支,通过质谱技术(mass spectrometry, MS)分析生物样本中的脂质分子,广泛应用于生物医学研究,如疾病标志物发现和机制解析。然而,随着高通量质谱技术的普及,脂质组学数据呈现爆炸式增长,研究者面临数据处理工具选择困难、流程标准化不足等挑战。本文旨在为研究者提供脂质组学数据分析工具的系统性指南,并通过Lipid Maps平台推出的交互式门户(https://www.lipidmaps.org/resources/tools)简化工具选择流程。
脂质组学数据分析涉及多个步骤,包括脂质结构鉴定、定量、统计分析和生物学解释。由于脂质结构的多样性和质谱数据的复杂性,传统的手动分析方法效率低下且易出错。例如,错误的峰识别可能导致假阳性脂质注释。本文指出,目前已有大量开源工具被开发用于特定任务(如LipidXplorer、LipidFinder等),但缺乏统一的比较标准,研究者需通过试错法选择工具,耗时且低效。
支持证据:
- 列举了脂质组学工具的应用案例,如LipidFinder用于SARS-CoV-2病毒包膜脂质分析(Saud et al., 2022),LION/web工具解析衰老过程中骨髓中性粒细胞的脂质变化(Lu et al., 2021)。
- 数据统计显示,Lipid Maps数据库在2021年全球用户超7.2万,工具下载量超4600次,凸显工具需求的广泛性。
为应对工具选择的挑战,Lipid Maps开发了交互式门户,将工具按七大任务分类:(1)脂质数据库;(2)质谱数据存储库;(3)靶向脂质组数据分析;(4)非靶向数据中的脂质鉴定;(5)非靶向数据中的脂质定量;(6)统计分析与可视化;(7)数据整合解决方案。
功能细节:
- 技术信息整合:每个工具页面提供许可证类型、操作系统兼容性、输入/输出格式等关键信息(如Lipid Maps结构数据库包含4.7万种脂质结构)。
- 任务导向设计:例如,靶向分析工具LipidCreator支持三步法设计MRM(多反应监测)实验,而SwissLipids数据库通过CHEBI本体论整合脂质代谢通路知识。
- 教程与互操作性:附带的补充教程展示了工具间的协同使用,例如将LipidCreator与Skyline结合用于靶向脂质定量。
论文详细阐述了七类工具的应用场景和代表性软件:
- 脂质数据库:Lipid Maps的LMSD(脂质结构数据库)和SwissLipids分别提供脂质结构注释和代谢通路关联。LMSD包含计算生成的110万种脂质变体(LMSID),支持基于质荷比(m/z)的批量搜索。
- 质谱数据存储库:Metabolomics Workbench和MetaboLights支持原始数据共享,符合FAIR原则(可查找、可访问、可互操作、可重用),后者提供脂质结构可视化功能。
- 靶向分析工具:LipidCreator和XCMS-MRM支持MRM实验设计,后者可直接调用MetLIN数据库的优化离子对参数。
- 非靶向分析工具:MS-DIAL和LipidHunter2支持数据依赖性采集(DDA)和数据非依赖性采集(DIA),并兼容离子淌度质谱数据。
脂质组学数据的终极目标是揭示脂质重塑的生物学机制。本文强调工具如LION/web和Biopan的作用:
- LION/web通过脂质本体论(ontology)将脂质按化学性质(如双键数量)或细胞定位分组,支持富集分析。例如,其PCA-LION模块可可视化多组样本的脂质动态变化。
- Biopan和WikiPathways的脂质门户提供通路映射功能,将脂质变化与已知生物合成途径关联。