分享自:

基于可解释机器学习的莲花部位来源识别:五种莲花部位的化学分析

期刊:Food ChemistryDOI:10.1016/j.foodchem.2022.134517

这篇文档属于类型a,即报告了一项原创性研究。以下是对该研究的学术报告:

主要作者及研究机构

该研究由Jingxian Huang、Zhen Li、Wei Zhang、Zhuoyuan Lv、Shuying Dong、Yan Feng、Rongxia Liu和Yan Zhao共同完成,所有作者均来自中国烟台大学药学院。该研究于2023年发表在《Food Chemistry》期刊上,文章编号为404卷134517号。

学术背景

该研究的主要科学领域是食品化学与代谢组学,具体聚焦于莲(Nelumbo nucifera Gaertn.)的不同部位的化学成分分析及其起源识别。莲作为一种具有悠久历史和广泛应用的水生植物,其不同部位(如叶、雄蕊、胚芽、花和叶基)在传统医学和食品工业中具有不同的用途。然而,这些部位的化学差异尚未得到充分研究,且在实际应用中常因缺乏明确的化学标记而导致误用或浪费。因此,该研究旨在通过代谢组学结合可解释的机器学习(Explainable Machine Learning, ML)技术,探索莲不同部位的化学特征,并开发一种可靠的起源识别方法。

研究流程

研究共分为以下几个步骤:

  1. 样品采集与处理
    研究从中国不同地区采集了47批莲的不同部位样品,包括11批莲叶(NF)、9批雄蕊(NS)、8批胚芽(NP)、10批花(NFL)和9批叶基(NFB)。所有样品经过研磨、过筛后,储存在-20°C条件下以备后续分析。

  2. 化学成分分析
    采用超高效液相色谱-四极杆轨道阱高分辨质谱(UHPLC-Q-Orbitrap HRMS)技术对样品进行非靶向代谢组学分析。通过分子网络(Molecular Networking)技术,共注释了151种化合物,其中34种为首次在莲中报道。此外,研究还使用UHPLC-DAD(二极管阵列检测)技术对28种代表性化合物进行了定量分析。

  3. 机器学习模型构建
    研究采用了极端梯度提升(XGBoost)算法,基于28种化合物的定量数据构建了分类模型。为了增强模型的可解释性,研究引入了SHAP(Shapley Additive Explanations)技术,用于解释模型输出和识别关键化学标记。

  4. 数据解释与验证
    通过SHAP技术,研究识别了5种关键化学标记物,分别为原花青素B1(Procyanidin B1)、阿米巴碱(Armepavine)、没食子酸(Gallic Acid)、黄芪苷(Astragalin)和芦丁(Rutin)。这些标记物在区分莲的不同部位中起到了关键作用。

主要结果

  1. 化学成分分析结果
    通过UHPLC-Q-Orbitrap HRMS技术,研究成功构建了莲不同部位的分子网络,并注释了151种化合物。其中,黄酮类、生物碱和酚酸是莲中最主要的生物活性成分。研究还首次报道了34种在莲中未被发现的化合物。

  2. 机器学习模型结果
    XGBoost模型在分类任务中表现出色,准确率、精确率、召回率和F1分数均达到100%,AUC值为1.0。SHAP技术进一步揭示了模型决策的关键化学标记物,包括原花青素B1、阿米巴碱、没食子酸、黄芪苷和芦丁。

  3. 化学标记物的作用
    研究结果表明,原花青素B1在莲叶中含量较高,阿米巴碱在胚芽中更为丰富,没食子酸在莲的不同部位中分布较为均匀,芦丁在莲叶和胚芽中含量较高,而黄芪苷在花中含量较高。这些化学标记物为莲不同部位的起源识别提供了可靠的依据。

结论

该研究通过代谢组学结合可解释的机器学习技术,成功开发了一种用于识别莲不同部位起源的方法。研究不仅提供了莲不同部位的化学成分信息,还识别了关键化学标记物,为莲的合理利用和减少浪费提供了科学依据。该方法的创新性在于将分子网络技术与机器学习模型结合,并通过SHAP技术增强了模型的可解释性。

研究亮点

  1. 创新性方法:首次将分子网络技术与可解释的机器学习模型结合,用于莲不同部位的起源识别。
  2. 关键化学标记物:识别了5种关键化学标记物,为莲的合理利用提供了科学依据。
  3. 高精度模型:XGBoost模型在分类任务中表现出色,准确率和AUC值均达到100%。

其他有价值的内容

该研究还为未来探索莲其他部位的化学成分及其潜在应用提供了基础。例如,研究指出莲叶和胚芽中富含黄酮类化合物,而生物碱主要分布在莲叶中,这些发现为莲在食品和医药领域的进一步开发提供了方向。

通过该研究,科研人员可以更好地理解莲不同部位的化学多样性,并为莲的工业化利用提供技术支持。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com