分享自:

基于数据融合的高光谱成像技术在单粒玉米种子活力无损检测中的应用

期刊:MeasurementDOI:10.1016/j.measurement.2025.117416

基于数据融合的高光谱成像技术用于单粒玉米种子活力无损检测研究

作者及机构
本研究由Rui Shi(第一作者)、Han Zhang、Cheng Wang、Yanan Zhou、Kai Kang及通讯作者Bin Luo*共同完成。作者团队来自两个机构:a) 北京市农林科学院智能装备研究中心(Research Center of Intelligent Equipment, Beijing Academy of Agriculture and Forestry Sciences);b) 江苏大学农业工程学院(School of Agricultural Engineering, Jiangsu University)。研究成果发表于Measurement期刊2025年第253卷,文章编号117416,DOI:10.1016/j.measurement.2025.117416。


学术背景

研究领域与科学问题
本研究属于农业信息技术与种子科学的交叉领域,聚焦高光谱成像(hyperspectral imaging, HSI)技术在玉米种子活力检测中的应用。玉米作为全球三大粮食作物之一,其种子活力是决定田间出苗率和储藏稳定性的关键指标。传统检测方法(如四唑染色法、电导率测定和标准发芽试验)存在破坏样本、耗时长、依赖操作经验等缺陷。因此,开发无损、快速、高通量的活力检测技术对保障农业生产具有重要意义。

研究目标
1. 比较玉米种子胚乳侧与胚芽侧光谱差异,验证高光谱成像技术检测单粒种子活力的可行性;
2. 设计四种数据融合策略(均值融合、拼接融合、堆叠融合、并行融合),建立基于双面光谱的活力检测模型;
3. 评估特征工程(预处理和特征波长提取)对模型性能的优化作用;
4. 确定适用于不同算法的最优数据处理流程。


研究方法与流程

1. 样本制备与处理

  • 样本来源:选用“郑单958”玉米种子(2021年产于甘肃张掖),初始含水量8%。
  • 人工老化处理:将3200粒种子分为4组(每组800粒),分别在41℃、98%湿度下老化0天(对照组)、2天、4天和6天,模拟不同活力水平。
  • 平衡处理:老化后置于通风环境中平衡2天,使含水量恢复至初始状态。

2. 高光谱图像采集与数据处理

  • 成像系统:可见-近红外高光谱成像仪(SOC710VP,光谱范围350–1050 nm,分辨率2.1 nm,256波段),配备可调角度卤素光源。
  • 数据采集:分别获取种子胚乳侧和胚芽侧的高光谱图像,通过反射率校正(公式1)消除仪器噪声和光照不均影响。
  • 感兴趣区域(ROI)提取:基于801.85 nm波段图像(种子与背景对比度最高),采用Otsu算法二值化后,通过膨胀-腐蚀操作生成掩膜图像,提取单粒种子平均光谱。

3. 标准发芽试验

  • 发芽条件:种子经1% NaClO消毒后,置于恒温恒湿培养箱(昼夜模式:20℃/12 h光照,20℃/12 h黑暗),发芽纸保持湿润。
  • 活力分类标准
    • 高活力种子:3天内根长≥种子长度、芽长≥种子长度1/2;
    • 低活力种子:4–7天发芽或未发芽。
  • 结果:未老化组发芽率96.88%,老化6天组降至0.13%,验证了人工老化对活力影响的显著性(表1)。

4. 数据融合策略设计

研究提出四种融合方案(图2–5),适用于传统机器学习与卷积神经网络(CNN):
1. 均值融合(Mean):对双面光谱同波段取均值,生成单条代表性光谱;
2. 拼接融合(Concat):将双面光谱首尾拼接为一条长光谱;
3. 堆叠融合(Stack):将双面光谱垂直堆叠为二维矩阵,输入二维CNN;
4. 并行融合(Parallel):双面光谱分别通过独立的一维CNN模块,特征拼接后输入全连接层。

5. 特征工程优化

  • 光谱预处理:对比10种方法(如SNV、MSC、SG平滑、一阶导数FD等),选择最优方案;
  • 特征波长提取:采用竞争性自适应重加权采样(CARS)算法降维,消除冗余信息。

6. 建模与验证

  • 算法选择
    • 传统机器学习:随机森林(RF)、AdaBoost、XGBoost、GBDT;
    • 深度学习:一维/二维CNN(结构见图6,含批量归一化和ELU激活函数)。
  • 数据划分:训练集:验证集:测试集=6:2:2;
  • 评估指标:测试集分类准确率。

主要研究结果

1. 光谱分析

  • 双面光谱差异:胚芽侧在400–560 nm反射率高于胚乳侧,而560–1000 nm反之(图7a),源于胚乳(淀粉/蛋白质)与胚芽(脂质/蛋白质)的化学成分差异。
  • 活力相关特征峰:650 nm(淀粉差异)、503 nm(可溶性糖)、920 nm(蛋白质)、980 nm(O-H/C-H键)的吸收峰与活力显著相关(图7c)。

2. 数据融合模型性能

  • 原始光谱模型:CNN模型(均值融合)准确率最高(94.7%),显著优于传统算法(如XGBoost最高88.3%)(表2)。胚芽侧模型普遍优于胚乳侧,印证胚芽对活力变化的敏感性。
  • 预处理优化后:CNN均值融合模型准确率提升至95.5%(表3),其中一阶导数(FD)和标准归一化(SNV)对噪声抑制效果最佳。
  • 特征波长提取:CARS算法将波长从225个降至约50个,模型参数减少但准确率保持稳定(图8),关键波长分布于400–1000 nm全波段(图9)。

3. 融合策略比较

  • 均值融合:通过光谱平均有效整合双面信息,抗噪能力最强;
  • 并行融合:双分支CNN独立提取特征,但易受噪声干扰(准确率92.5%)。

结论与价值

科学意义

  1. 首次系统验证了高光谱成像结合数据融合策略检测单粒玉米种子活力的可行性,为种子质量无损检测提供了新范式;
  2. 揭示了胚芽侧光谱对活力变化的更高敏感性,为后续传感器设计提供理论依据;
  3. 提出的均值融合-CNN框架在噪声抑制和特征提取方面表现优异,可推广至其他作物种子检测。

应用价值

  • 农业实践:实现种子活力的快速分选,降低低活力种子导致的田间减产风险;
  • 技术延伸:该框架可适配便携式设备,适用于种子企业、质检机构及科研单位。

研究亮点

  1. 方法创新:首次将四种数据融合策略与特征工程结合,优化高光谱数据利用率;
  2. 技术突破:CNN模型在噪声环境下仍保持高鲁棒性,克服了传统算法对预处理的依赖;
  3. 跨学科融合:将化学计量学、机器学习和农业工程相结合,推动精准农业技术发展。

(注:全文严格遵循术语规范,如首次出现的专业术语均标注英文原文,数据分析流程与结果均引用原文图表编号及数据支撑。)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com