本研究由王雨莹(浙江农林大学数学与计算机科学学院)、戴宇佳、王悦悦(浙江农林大学光机电工程学院)等合作完成,发表于《食品工业科技》2024年第45卷第18期。论文题为《基于近红外光谱技术的香榧蛋白质和脂肪含量无损检测方法研究》,聚焦食品科学与农业工程交叉领域,旨在解决传统香榧品质检测方法存在的破坏性、低效性和主观性问题。
香榧作为具有两千多年栽培历史的珍贵经济作物,其蛋白质(13.01%-16.48%)和脂肪(50.02%-56.96%)含量是核心品质指标。传统检测依赖凯氏定氮法(GB 5009.5-2016)和索氏提取法(GB 5009.6-2016),存在耗时长(6-10小时/样本)、破坏样本等缺陷。近红外光谱技术(Near-Infrared Spectroscopy, NIRS)因其非破坏性、快速(32秒/样本)等优势,已在坚果品质检测中展现潜力,但针对香榧存储条件鉴别及成分定量分析的研究尚属空白。本研究创新性地将化学计量学与NIRS结合,建立存储条件定性鉴别和成分定量预测的双重模型体系。
研究采集122组香榧果仁样本(总重4270g),按存储条件分为5类:新鲜样本、10℃保存6/12个月、-18℃冷冻6/12个月。采用丹麦FOSS公司DS2500F光谱仪在850-2500nm波段采集光谱,分辨率0.5nm,硅/硫化铅双检测器覆盖不同波段,每个样本重复扫描3次取均值。特别设计大样品杯装样方案确保光路密闭,消除环境干扰。
对60组子样本进行标准化验: - 蛋白质检测:按GB 5009.5-2016标准,使用瑞士BÜCHI K-370全自动凯氏定氮仪,消煮温度380℃,蒸馏参数优化后测定。 - 脂肪检测:依据GB 5009.6-2016,采用上海纤检MF-105索氏提取器,石油醚为溶剂,提取至玻璃棒无油斑为终点。
定性模型构建: - 样本划分:Kennard-Stone算法按3:1划分训练集(90组)与测试集(30组) - 特征筛选:遗传算法(Genetic Algorithm, GA)优选光谱波段,参数设置:群体数122,变异概率0.05 - 模型构建:卷积神经网络(CNN)架构含3层卷积层(核尺寸5×5)、Dropout层(概率0.2),结合多元散射校正(Multiplicative Scatter Correction, MSC)预处理
定量模型构建: - 特征筛选:竞争性自适应重加权采样法(Competitive Adaptive Reweighted Sampling, CARS)筛选41个蛋白质特征波长和56个脂肪特征波长 - 模型对比:测试偏最小二乘法(PLS)、径向基函数神经网络(RBF)、极限学习机(ELM) - 优化方案:二阶导数(Second Derivative, D2)预处理消除CO₂/H₂O干扰
原始光谱在1200nm(C-H键二级倍频)、1450nm(N-H键振动)、1728nm(脂肪CH基团)、1934nm(蛋白质合频峰)、2300nm(醇类CH基团)处出现特征峰。经D2预处理后,基线漂移消除率达92%,特征峰信噪比提升3.6倍。
GA-CNN模型在MSC预处理后表现最优: - 准确率99.2%(测试集) - 各类别Recall均>98.5% - 特征波长集中在1350-1700nm和1850-2000nm波段
蛋白质预测: - D2-CARS-PLS模型R²=0.977,RMSE=0.030% - 特征波长与胺I/II峰(1450/1934nm)高度吻合 - RPD=6.586显示优异稳定性
脂肪预测: - D2-CARS-PLS模型R²=0.984,RMSE=0.027% - 1728nm处CH基团特征峰贡献率达67% - 预测时间较化学法缩短98.5%
与传统方法相比: - 检测效率:单样本分析时间从6+小时缩短至分钟 - 成本:试剂消耗降低90% - 准确性:蛋白质预测误差<0.05%(化学法平均误差0.12%)
本研究首次建立香榧存储时间(6/12个月)与条件(常温/冷冻)的精准鉴别体系,并实现蛋白质/脂肪含量的快速预测。科学价值体现在: 1. 发现1934nm波段与香榧蛋白质含量的特异性关联 2. 验证CNN在农产品存储条件鉴别中的优越性(较SVM提升4.7%准确率) 3. 开发D2-CARS-PLS组合算法,特征波长数减少68%而精度保持
应用层面: - 为香榧仓储品质监控提供实时检测方案 - 所建模型可集成至便携式检测设备 - 方法学可扩展至其他坚果品质检测
研究中开发的D2-CARS特征筛选策略已成功应用于松籽品质检测(未发表数据),显示该方法在坚果领域的普适性。此外,所采集的光谱数据库(含122组全波段数据)可为后续研究提供基准数据集。