类型a:学术研究报告
作者及研究机构
本研究由来自RIKEN综合医学科学中心的Hiroshi Tsugawa和Makoto Arita领衔的跨国团队完成,合作机构包括日本RIKEN可持续资源科学中心、大阪大学信息科学与技术研究生院、美国耶鲁大学公共卫生学院、捷克科学院生理学研究所等18家科研单位,研究成果发表于*Nature Biotechnology*期刊。
学术背景
脂质组学(lipidomics)是代谢组学的重要分支,研究生物体内脂质的结构、功能及代谢网络。脂质作为细胞膜组分、信号分子和能量载体,其结构多样性(超过40,000种化合物)对生物功能具有决定性影响。然而,现有脂质分析软件存在覆盖度低、标准化不足等问题,尤其在保留时间(retention time, RT)、碰撞截面积(collision cross-section, CCS)和串联质谱(MS/MS)信息整合方面缺乏系统性解决方案。
MS-DIAL 4的开发旨在建立一个全面兼容脂质组学标准倡议(Lipidomics Standards Initiative, LSI)的分析平台,通过整合117个脂质亚类的质谱裂解规律和离子淌度(ion mobility)数据,实现高可信度的脂质注释与半定量分析。
研究流程与实验方法
1. 样本与数据收集
- 研究对象:涵盖人类血浆、19种小鼠组织、4种哺乳动物培养细胞、9种藻类和3种植物,共计1,056个脂质组学样本,来自81项独立研究的LC-MS/MS和LC-IM-MS/MS数据。
- 仪器平台:使用10种不同品牌的质谱仪(如Sciex TripleTOF、Bruker timsTOF Pro等),结合多种脂质提取方法(如氯仿/甲醇单相萃取法)。
脂质注释流程
技术优化与数据库构建
验证与性能评估
主要结果
1. 数据库覆盖度
MS-DIAL 4整合了8,051种脂质的RT、CCS和MS/MS信息,其中6,570种在分子物种水平(molecular species level)完成注释,涵盖哺乳动物、植物和藻类特异性脂质(如醚脂质、鞘脂类)。
技术突破
生物学应用
结论与价值
1. 科学意义
MS-DIAL 4首次将脂质注释标准化延伸至离子淌度维度,其决策树算法和机器学习预测模型为脂质组学数据可比性树立了新标杆。
亮点
- 全流程解决方案:从原始数据导入到mzTab-M导出,兼容主流厂商的IM-MS数据。
- 覆盖度领先:脂质亚类数量较前代版本提升2倍,CCS库覆盖101个亚类(补充表8)。
- 低FDR保障:通过RT、CCS和MS/MS三维过滤,将注释错误率控制在%。
其他价值
研究团队公开了所有源码、质谱库和半定量数据,并通过DropMET(索引dm0022-dm0031)共享原始数据,推动脂质组学数据的开放科学实践。