这篇文档属于类型a,即单篇原创研究的学术报告。以下是该研究的详细介绍:
该研究由Guannan Wang、Na Wang、Ying Dong、Jinming Liu、Peng Gao和Rui Hou共同完成,主要作者来自黑龙江八一农垦大学信息与电气工程学院、黄埔海关技术中心等单位。研究发表于《Infrared Physics & Technology》期刊,2025年第145卷,文章编号为105688,2024年12月24日在线发表。
蓝莓因其高营养价值和经济价值在市场上具有重要地位,但市场上存在以次充好的现象,严重影响了消费者权益和品牌形象。传统的蓝莓原产地鉴别方法复杂且具有破坏性,限制了其广泛应用。近红外光谱(Near-Infrared Spectroscopy, NIRS)技术具有无损、高效的特点,被广泛应用于烟草、食品等行业。然而,NIRS数据具有高维度、非线性和冗余信息的特点,直接使用原始数据难以获得理想结果。因此,研究旨在通过结合波长选择算法,构建蓝莓原产地无损识别模型,以实现快速、准确的原产地鉴别。
研究主要包括以下几个步骤:
样本收集与光谱数据采集
研究共收集了来自中国4个产区(辽宁丹东、四川大凉山、云南澄江、云南昭通)和1个国外产区(智利)的440个蓝莓样本。光谱数据使用NIR-R210手持式近红外光谱仪采集,光谱范围从900 nm到1700 nm,每个光谱包含355个数据点。根据蓝莓大小,样本被分为大果、中果和小果三类,分别采用不同的采集方式。
数据预处理
光谱数据采集过程中受到实验环境、设备状态等因素的干扰,因此研究采用Savitzky-Golay(SG)平滑去噪和标准正态变量变换(SNV)对光谱数据进行预处理,以消除噪声和光谱线偏差。
波长选择方法
研究采用了三种波长选择方法:连续投影算法(Successive Projections Algorithm, SPA)、麻雀搜索算法(Sparrow Search Algorithm, SSA)以及多策略混合麻雀搜索算法(ZOSSA)。SPA通过投影原理选择冗余信息最少的波长变量,SSA模拟麻雀觅食行为进行波长选择,ZOSSA则在SSA的基础上结合了最优拉丁超立方体和鱼鹰算法,进一步优化了波长选择效果。
模型构建与评估
研究使用支持向量机(Support Vector Machine, SVM)作为识别模型,分别将SPA、SSA和ZOSSA选择的波长变量作为输入子集,构建了SPA-SVM、SSA-SVM和ZOSSA-SVM三种模型。模型性能通过准确率、精确率、召回率和F1分数等指标进行评估。
光谱分析
不同产区的蓝莓光谱反射率趋势一致,但在980 nm、1200 nm和1440 nm处存在吸收峰,分别与O-H、C-H等基团的振动有关。这些吸收峰的差异反映了不同产区蓝莓在水分、糖分等成分上的差异。
波长选择结果
SPA选择了30个波长变量,SSA选择了148个波长变量,而ZOSSA将波长变量从148个减少到36个。ZOSSA选择的波长变量在900 nm-1050 nm、1150 nm-1250 nm、1400 nm-1480 nm和1500 nm-1650 nm四个区域集中分布,与SPA选择的波长变量有一定的相似性。
模型性能评估
ZOSSA-SVM模型在测试集上的准确率、精确率、召回率和F1分数分别为96.21%、95.12%、94.78%和94.94%,显著优于SPA-SVM和SSA-SVM模型。SPA-SVM和SSA-SVM模型在测试集上的准确率分别为89.39%和90.15%,ZOSSA-SVM模型在减少波长变量的同时提高了模型性能。
研究通过结合近红外光谱技术和波长选择算法,成功构建了蓝莓原产地无损识别模型。ZOSSA-SVM模型在减少波长变量的同时,显著提高了模型性能,实现了快速、准确、无损的蓝莓原产地鉴别。该方法不仅适用于蓝莓,还为其他农产品的原产地鉴别提供了新的思路。
研究还探讨了不同波长选择方法在模型性能上的差异,并通过主成分分析(PCA)对波长选择结果进行了可视化分析,进一步验证了ZOSSA在波长选择上的优越性。此外,研究还指出了动态参数优化和波长选择特异性等问题,为未来的研究提供了方向。