分享自:

利用傅里叶变换近红外光谱和机器学习预测多种大豆品种的组成

期刊:Food ChemistryDOI:10.1016/j.foodchem.2025.145479

该文档属于类型a,是一篇关于利用傅里叶变换近红外光谱(FT-NIRS)和机器学习预测大豆成分的原创研究论文。以下是针对该研究的学术报告:


作者及机构

本研究由Guillaume Lassalle(通讯作者)、Stéphane MichauxPhilippe PollienIsabelle PrivatClaire Denis合作完成。作者团队主要来自Nestlé Institute of Agricultural Sciences(法国)和Nestlé Institute of Food Sciences(瑞士)。论文发表于期刊Food Chemistry,2025年7月正式在线发表(Volume 492, Article 145479)。


学术背景

研究领域与动机

本研究属于农业与食品科学交叉领域,聚焦大豆(*Glycine max*)成分的快速无损检测技术。随着全球人口增长(预计2050年达100亿)和气候变化压力,大豆作为重要植物蛋白来源的需求激增,但其传统成分分析方法(如凯氏定氮、气相色谱等)成本高、耗时长。傅里叶变换近红外光谱(FT-NIRS)因其快速、非破坏性特点成为潜在替代技术,但现有模型仅能预测宏量成分(如蛋白质、脂肪),无法覆盖微量营养素、氨基酸、挥发性有机物(VOCs)等关键指标。

研究目标

开发基于FT-NIRS结合机器学习的模型,实现大豆全籽和粉末中108种成分的高通量预测,包括:
1. 宏量成分(蛋白质、脂肪、纤维等);
2. 脂肪酸与氨基酸;
3. 微量营养素(如铁、锌)、维生素(B1、B3等);
4. 植酸、异黄酮、胰蛋白酶抑制剂;
5. 51种挥发性有机物(VOCs)。


研究流程与方法

1. 样本制备与成分分析

  • 样本来源:217份大豆样本(159个品种),来自欧洲(法国)和西非(尼日利亚)的温带与热带产区,涵盖成熟度组000-II。
  • 成分检测
    • 宏量成分:通过ISO标准方法测定水分、蛋白质(凯氏定氮)、脂肪(酸水解-溶剂提取)、灰分(550℃灼烧)、膳食纤维(酶解法)及可溶性糖(高效阴离子交换色谱,HPAEC)。
    • 脂肪酸:甲酯化后通过气相色谱-质谱(GC-MS)分析。
    • 氨基酸:酸水解/氧化水解后,采用超高效液相色谱(UPLC)与荧光检测。
    • 微量营养素:电感耦合等离子体光谱(ICP-OES/MS)测定。
    • VOCs:顶空固相微萃取-气相色谱(HS-SPME-GC/MS)分析。

2. FT-NIRS光谱采集与预处理

  • 仪器:Thermo Antaris II FT-NIR光谱仪(10,000–4,000 cm⁻¹反射模式)。
  • 预处理方法:测试5种光谱变换以增强信号:
    • 一阶导数(D1)、标准正态变量(SNV)、乘性散射校正(MSC)、对数变换(log)、连续统去除(CR)。

3. 机器学习建模

  • 算法:弹性网络回归(Elastic Net)、偏最小二乘回归(PLSR)、支持向量回归(SVR)、随机森林(RF)、极限梯度提升(XGBoost)。
  • 流程
    1. 数据集按品种划分为训练集(2/3)和测试集(1/3),采用Kennard-Stone算法确保独立性。
    2. 通过5折交叉验证优化超参数。
    3. 评估指标:决定系数(R²)、归一化均方根误差(NRMSE)、残差预测偏差(RPD)。

主要结果

1. 宏量成分预测

  • 蛋白质与脂肪
    • 蛋白质预测最佳(R²≥0.90,RPD≥3.2),PLSR结合MSC变换效果最优。
    • 脂肪预测(R²=0.78)需D1变换与SVR组合。
  • 其他成分:灰分、纤维和糖类预测精度较低(R²≤0.59),因吸收特征弱且浓度低。

2. 脂肪酸与氨基酸

  • 多不饱和脂肪酸:总PUFA预测良好(R²≥0.77),亚油酸(R²=0.72)通过CR变换显著提升精度(+46%)。
  • 氨基酸:15种氨基酸(如精氨酸、谷氨酸)预测准确(R²≥0.70,NRMSE≤14%),D1变换是关键。

3. 微量成分与VOCs

  • 维生素B9:UPLC-MS/MS标定后,模型R²达0.89(RPD=3.13)。
  • VOCs:9种(如2-庚烯醛、α-蒎烯)可通过CR/XGBoost组合预测(R²≥0.70),与风味特性相关。

结论与价值

科学意义

  1. 方法学创新:首次将CR变换应用于FT-NIRS数据,显著提升低浓度成分(如亚油酸)的预测能力。
  2. 技术扩展:突破了传统FT-NIRS仅限宏量成分的局限,覆盖氨基酸、VOCs等复杂指标。

应用价值

  • 育种与质量控制:加速大豆品种筛选,优化肉类替代品配方。
  • 可持续农业:支持低环境足迹的精准农业实践。

研究亮点

  1. 多组分覆盖:一次性预测108种成分,为迄今最全面的FT-NIRS大豆研究。
  2. 机器学习优化:SVR和PLSR在多数场景中表现最优,验证了算法对光谱多共线性的适应性。
  3. 跨区域样本:涵盖温带与热带品种,增强模型普适性。

其他价值

  • 数据公开建议:作者未公开数据,但强调了模型可迁移性验证的必要性。
  • 未来方向:结合高光谱成像技术,进一步提升微量成分检测限。

(报告总字数:约1500字)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com