这篇文档属于类型a,即报告了一项原创性研究。以下是基于文档内容的学术报告:
作者及机构
本研究由Jinming Liu、Xin Luo、Dongjie Zhang、Chunqi Wang、Zhengguang Chen和Xiaoyu Zhao共同完成。作者分别来自黑龙江八一农垦大学信息与电气工程学院、黑龙江八一农垦大学农业工程博士后流动站、国家粗粮工程技术中心以及黑龙江八一农垦大学食品学院。该研究发表于2023年11月2日的《Infrared Physics & Technology》期刊。
学术背景
水稻是全球主要粮食作物之一,尤其在中国,超过65%的人口以水稻为主食。水稻的营养价值主要由其蛋白质含量决定,蛋白质含量直接影响水稻的种子强度和食用品质。传统的蛋白质含量检测方法(如凯氏定氮法、Lowry法、杜马斯法和Bradford法)虽然准确,但过程繁琐、耗时长且成本高,同时需要大量试剂并破坏样品。近红外光谱技术(Near-Infrared Spectroscopy, NIRS)作为一种无损检测技术,能够快速定量测定农产品中的蛋白质含量,成为替代传统化学检测方法的重要发展方向。然而,高维光谱数据中的维度诅咒问题严重影响了NIRS定量检测的建模性能。为了解决这一问题,本研究提出了一种基于特征波长选择的水稻蛋白质含量快速检测模型,旨在简化建模复杂性并提高检测精度。
研究流程
本研究包括以下主要步骤:
1. 样品采集与处理
研究从黑龙江省的五个主要水稻产区(查哈阳、方正、建三江、五常和香水)采集了150个水稻样品。每个产区采集30个样品,采用五点采样法确保样品的代表性和真实性。样品经过脱壳、碾磨和粉碎后,通过40目筛网,最终获得水稻粉末样品并储存于干燥阴凉处。
2. 光谱数据采集
使用Tango近红外光谱仪(Bruker Optics, Ettlingen, Germany)测量水稻粉末样品的近红外漫反射光谱。光谱扫描范围为3946至11542 cm⁻¹,分辨率为8.0 cm⁻¹,每个样品扫描32次,背景每小时扫描一次。最终取三次扫描的平均值作为原始光谱数据。
3. 蛋白质含量测定
采用凯氏定氮法(GB 5009.5–2016)测定水稻蛋白质含量。样品经过消化和氮含量测定后,使用转换系数5.95计算蛋白质含量。
4. 特征波长选择方法
本研究提出了两种特征波长选择方法:
- BI-PLS-GSA:结合后向区间偏最小二乘法(Backward Interval Partial Least Squares, BI-PLS)和遗传模拟退火算法(Genetic Simulated Annealing Algorithm, GSA),先通过BI-PLS选择光谱特征区间,再利用GSA进一步优化,去除无关和共线的冗余波长变量。
- BI-PLS-SABPSO:结合BI-PLS和模拟退火二进制粒子群优化算法(Simulated Annealing Binary Particle Swarm Optimization Algorithm, SABPSO),通过SABPSO对BI-PLS选择的光谱特征区间进行二次优化,筛选出与蛋白质含量高度相关的特征波长。
5. 多元分析方法
采用偏最小二乘法(Partial Least Squares, PLS)建立定量回归模型。通过蒙特卡洛交叉验证(Monte-Carlo Cross-Validation, MCCV)和预测残差平方和(Prediction Residual Error Sum of Squares, PRESS)选择最优潜变量(Latent Variables, LVs),并利用确定系数(R²)、均方根误差(Root Mean Square Error, RMSE)、相对均方根误差(Relative Root Mean Square Error, RRMSE)和残差预测偏差(Residual Predictive Deviation, RPD)评估模型性能。
主要结果
1. 特征波长选择结果
BI-PLS将光谱空间划分为58个区间,最终选择了14个特征区间,包含446个波长变量。进一步通过BI-PLS-GSA和BI-PLS-SABPSO优化后,分别筛选出276个和194个特征波长。BI-PLS-SABPSO的优化效果优于BI-PLS-GSA,其筛选的特征波长与蛋白质含量的相关性更高。
2. 模型性能评估
BI-PLS-SABPSO模型在验证集和独立测试集上的R²分别为0.949和0.956,RMSE分别为0.174%和0.214%,RRMSE分别为2.621%和3.118%,RPD分别为4.235和4.500,表明该模型能够满足水稻蛋白质含量的快速准确检测需求。
3. 样品分布与模型适用性
样品集划分结果显示,校准集、验证集和测试集的变异系数分别为14.761%、11.272%和14.324%,表明样品分布范围广泛,有利于建立稳健的回归模型。BI-PLS-SABPSO模型对未知样品的预测能力较强,具有较高的适用性和鲁棒性。
结论与意义
本研究提出了一种基于NIRS和特征波长选择的水稻蛋白质含量快速检测方法,结合BI-PLS和智能优化算法(GSA和SABPSO)筛选特征波长,建立了高精度的定量回归模型。研究结果表明,BI-PLS-SABPSO模型在水稻蛋白质含量检测中表现出色,具有快速、准确和无损的优势。该方法为农产品质量的快速检测提供了一种新的思路,具有重要的科学和应用价值。
研究亮点
1. 提出了结合BI-PLS和智能优化算法的特征波长选择策略,显著提高了建模精度。
2. BI-PLS-SABPSO模型在水稻蛋白质含量检测中表现出色,为快速检测提供了可靠的工具。
3. 研究样品覆盖黑龙江省主要水稻产区,模型具有较高的适用性和鲁棒性。
4. 该方法为其他农产品质量的无损检测提供了参考,具有广泛的应用前景。
其他有价值内容
本研究还探讨了样品粒径对检测精度的影响,指出较小的粒径有助于提高建模精度,但同时对样品预处理提出了更高要求。未来研究将进一步优化样品预处理方法,并扩大样品范围以验证模型的普适性。
这篇报告详细介绍了研究的背景、方法、结果和意义,为相关领域的研究人员提供了全面的参考。