分享自:

基于高光谱成像的玉米籽粒蛋白质和淀粉含量快速检测

期刊:computers and electronics in agricultureDOI:10.1016/j.compag.2024.108718

本研究由Mengmeng Qiao(中国农业大学)、Tao Cui(中国农业大学)、Guoyi Xia(Universität Bremen)、Yang Xu(中国农业大学,通讯作者)、Yibo Li(中国农业大学)、Chenlong Fan(南京林业大学)、Shaoyun Han(中国农业大学)和Jiaqi Dong(中国农业大学)合作完成,发表于2024年2月的《Computers and Electronics in Agriculture》期刊第218卷,文章编号108718。

学术背景
该研究属于农业工程与食品检测交叉领域,聚焦高光谱成像(Hyperspectral Imaging, HSI)技术在玉米籽粒蛋白质和淀粉含量快速检测中的应用。玉米作为中国主要粮食作物,其品质评估依赖于蛋白质和淀粉含量的精准测定。传统生化检测方法虽准确但耗时且破坏样本,而现有光谱技术需干燥样本以提高精度,延长了检测周期。针对这一研究空白,本研究旨在开发一种基于HSI光谱与图像特征融合的非破坏性检测方法,直接对含水玉米籽粒进行快速、高精度成分分析。

研究流程
1. 样本制备
- 研究对象:18个玉米品种,分5个收获期采集,共270组样本(每组24粒籽粒),含水量范围12.26%~50.89%。
- 预处理:籽粒表面水分擦拭后立即进行高光谱成像,避免储存影响。

  1. 高光谱数据采集与校正

    • 使用自主研发的HSI系统(SOC710VP相机,波长范围374.98–1038.79 nm),采集128个波段的反射率数据。
    • 图像校正:通过标准白板反射率归一化,消除光照不均匀性。
  2. 特征提取

    • 光谱特征:提取399.75–1005.80 nm范围内的平均反射率,采用SG平滑(Savitzky-Golay)、一阶导数(1D)、多元散射校正(MSC)和标准正态变量变换(SNV)预处理。
    • 图像特征
      • 颜色特征:HSV色彩空间的一阶、二阶、三阶矩(共9维)。
      • 纹理特征:灰度共生矩阵(GLCM)的对比度、相关性、能量、同质性和熵(共5维)。
  3. 特征选择与建模

    • 特征波长筛选:采用连续投影算法(SPA)和无信息变量消除(UVE),分别将波长维度从128降至12–62个。
    • 模型构建:对比偏最小二乘回归(PLSR)、支持向量回归(SVR)和极限学习机(ELM)算法,建立40种预测模型。
    • 数据融合:将特征波长与颜色/纹理特征融合,优化模型精度。
  4. 模型验证

    • 样本按3:1分为校准集(203组)和预测集(67组),通过相关系数(R)、均方根误差(RMSE)、性能偏差比(RPD)和误差范围比(RER)评估模型性能。

主要结果
1. 预处理与算法比较
- MSC和SNV预处理显著提升模型性能(RPD>2),ELM算法优于PLSR和SVR(蛋白质模型R_p=0.8997,淀粉模型R_p=0.8756)。
- 特征波长筛选后,模型变量减少至12–39个,精度进一步提高(蛋白质SPA-ELM模型R_p=0.8997,淀粉UVE-ELM模型R_p=0.8756)。

  1. 数据融合效果

    • 蛋白质检测:SNV-SPA-颜色-ELM融合模型最优(R_p=0.9228,RPD=2.5985),颜色特征贡献显著(可见光波段特征波长占比高)。
    • 淀粉检测:MSC-UVE-纹理-ELM融合模型最优(R_p=0.8847,RPD=2.3832),近红外波段纹理特征起主导作用。
  2. 水分干扰克服

    • 筛选的特征波长避开了水分敏感波段(如960 nm),证实模型在含水条件下仍具鲁棒性。

结论与价值
本研究首次将HSI光谱与图像特征融合应用于含水玉米籽粒的蛋白质和淀粉检测,开发了SNV-SPA-颜色-ELM(蛋白质)和MSC-UVE-纹理-ELM(淀粉)两种高精度模型(RPD>2,RER>10),变量数分别降至27和33维。其科学价值在于:
1. 提出了含水样本直接检测的新方法,突破了传统干燥处理的时效限制;
2. 验证了颜色和纹理特征对成分预测的互补性,为多模态数据融合提供范例;
3. 为谷物品质现场检测设备开发奠定了算法基础。

研究亮点
1. 方法创新:首次实现含水玉米籽粒的无损快速检测,检测时间从传统方法的数小时缩短至分钟级。
2. 技术融合:结合HSI光谱与机器视觉特征,模型精度超越单一光谱技术(RP提升5%~8%)。
3. 工程适用性:自主研发的高光谱采集系统(SOC710VP)与算法流程可直接应用于产线检测。

其他价值
研究团队公开了模型构建的完整参数(如ELM隐藏层神经元数、SPA/UVE筛选波长列表),为后续研究提供可复现的基准。此外,样本覆盖18个品种和5个生长期,增强了模型的泛化能力。未来可扩展至其他谷物(如小麦、水稻)的品质检测领域。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com