分享自:

基于高光谱图像与卷积神经网络的棉花渍涝胁迫检测

期刊:int j agric & biol engDOI:10.25165/j.ijabe.20211402.6023

关于“基于高光谱图像与卷积神经网络的棉花涝渍胁迫检测”研究的学术报告

本研究由山东理工大学农业工程与食品科学学院的赵晶、潘方江、李明志、兰玉彬*、陆黎群*、杨东健、温玉婷等学者组成的团队完成,并于2021年3月发表于国际期刊 Int J Agric & Biol Eng (IJABE) 第14卷第2期上。该研究属于农业信息技术与精准农业领域,具体聚焦于利用高光谱成像(Hyperspectral Imaging, HSI)技术和深度学习算法,对棉花早期的涝渍胁迫进行无损、高效的识别与分类。

学术背景与研究目标

在全球气候变化导致极端天气事件频发的背景下,涝渍已成为影响全球棉花生产的主要问题之一。棉花对涝渍胁迫高度敏感,尤其是在蕾期,早期涝渍会显著降低棉花的有效铃数、减少干物质积累,并最终导致严重减产。因此,尽早、准确地检测涝渍胁迫的发生及其持续时间,对于指导田间管理、采取补救措施、评估产量损失以及优化灾害保险理赔等环节均具有至关重要的实践价值。

传统的植物胁迫检测方法多依赖于人工田间调查或基于特定光谱指数的分析。然而,人工方法效率低且主观性强;而基于少数波段构建的植被指数,虽然有效,但可能未能充分利用高光谱数据蕴含的丰富信息。高光谱图像能获取目标在可见光到近红外范围内数百个连续、窄波段的光谱信息,提供了远超过RGB或普通多光谱图像的诊断潜力。与此同时,卷积神经网络(Convolutional Neural Network, CNN)作为一种强大的深度学习模型,在图像分类与特征自动提取方面展现出卓越性能,已在多种作物病害检测中得到成功应用。然而,在棉花涝渍胁迫的早期、分级(按胁迫时长)检测方面,结合高光谱图像与CNN的研究尚不多见。

基于此,本研究设定了明确的研究目标:1) 获取不同涝渍胁迫天数下的棉花叶片高光谱图像;2) 对所获图像进行预处理与分析;3) 比较涝渍胁迫下与正常条件下棉花叶片的光谱反射率差异;4) 基于预处理后的高光谱图像,利用CNN模型实现对棉花涝渍胁迫持续时间(0, 2, 4, 6, 8, 10天)的准确分类。

详细工作流程

本研究的设计与执行包含一个严谨、系统的流程,主要可分为实验设计、数据采集、数据预处理与特征提取、以及模型构建与分类四个核心环节,每个环节都包含了精细的操作步骤。

第一环节:实验设计与胁迫处理。 研究于2019年夏季在山东省临清市的山东棉花研究中心试验站进行。该区域地处黄河流域棉区,气候与土壤条件具有代表性。实验采用了一种可控的模拟涝渍方法。研究团队构建了底部无底、由混凝土墙分隔的土池,以精确控制每个小区的水层。实验共设置12个小区,分为3个涝渍处理区(每个处理区内设3个重复小区)和1个正常灌溉对照区。棉花于2019年4月28日播种,至7月4日(播种后约66天,正值蕾期)开始进行涝渍处理,持续10天。在涝渍处理期间,通过人工灌溉确保处理区土壤表面维持10厘米水层,并利用电动防雨棚排除自然降水的干扰。对照区则按当地经验进行常规灌溉。这种设计确保了不同胁迫时长处理的可控性与可比性。

第二环节:高光谱图像数据采集。 在开始涝渍处理后的第2、4、6、8、10天,分别进行数据采集。使用德国Cubert公司的UHD-185高光谱成像相机系统,该系统光谱采集范围为450-950纳米,包含126个光谱通道,图像空间分辨率为1000×1000像素。每次采样时,从每个小区随机采集6片健康无病的棉花新鲜叶片,置于暗箱内的线性移动平台上进行扫描。为校正环境光与设备暗电流的影响,每次采集前均获取标准白板与全暗环境下的参考数据。根据公式,将原始反射强度转换为相对反射率。整个实验共计获得360幅高光谱图像(对照90幅,各胁迫天数共270幅)。

第三环节:数据预处理与特征提取。 这是将原始数据转化为可供模型学习的有效特征的关键步骤,又分为光谱数据处理和图像数据处理两条并行路径。 * 光谱数据分析路径: 首先,使用ENVI 5.3软件,在每幅高光谱图像的叶片区域手动选取6个100×100像素的兴趣区(Region of Interest, ROI),提取其平均光谱反射率数据。由于原始光谱存在噪声和基线漂移,研究采用Savitzky–Golay (SG)平滑卷积法和多元散射校正(Multiple Scattering Correction, MSC)对光谱数据进行预处理,以增强信噪比和可比性。处理后的光谱数据主要用于可视化分析不同胁迫天数下的光谱曲线变化规律。 * 图像处理与特征提取路径: 此路径旨在为CNN模型准备输入数据。首先,需要从高光谱图像中分割出叶片目标。研究采用了一种基于图像处理的方法:将高光谱数据转换为灰度图,利用OpenCV库中的Canny算子进行边缘检测,再通过形态学闭运算填充轮廓间隙,生成二值化的叶片掩模(Mask)。用此掩模对原始高光谱图像进行处理,即可去除背景,得到仅包含叶片信息的图像。接着,为解决高光谱数据维度高、波段间信息冗余的问题,并减少后续模型的计算负担,研究采用主成分分析(Principal Component Analysis, PCA)进行降维。分析发现,第一主成分(PC1)包含了原始高光谱图像超过91%的信息。因此,研究将每幅高光谱图像经过PCA后得到的PC1分量图像,作为代表该图像核心光谱空间特征的单通道灰度图,用于后续的CNN训练。 * 数据集构建与增强: 由于原始图像数量(360幅)对于训练深度CNN模型可能不足,为避免过拟合,研究采用了创新的数据增强策略。除了常规的翻转、旋转等操作外,本研究特别设计了一种“波段随机丢弃”策略。鉴于高光谱波段间的高相关性,随机丢弃部分波段并不会导致图像信息发生根本性改变,但能有效增加数据集的多样性。对每幅涝渍胁迫图像进行5轮随机丢弃,对照图像进行4轮,最终将图像总数扩充至10,080幅。所有这些图像均经过PCA处理,取其PC1图像构成最终数据集。数据集按3:1的比例划分为训练集(7,560幅)和验证集(2,520幅),并按胁迫天数(0, 2, 4, 6, 8, 10天)分别存放于相应文件夹中,以便模型进行有监督学习。

第四环节:卷积神经网络模型构建与分类。 研究选择了两个经典的CNN模型架构作为分类器进行对比:GoogleNet Inception-v3 (GlnI-v3) 和 VGG-16。两个模型的训练与验证均在Python 3.7环境下,使用Keras库完成。模型采用随机梯度下降(Stochastic Gradient Descent, SGD)进行权重更新,学习率设置为0.01。损失函数选择交叉熵(Cross Entropy)。训练时,批量大小(Batch Size)设为32,总训练轮数(Epochs)设为1000。为评估模型稳定性,还采用了5折交叉验证。模型输入为前述处理好的PC1单通道图像,输出为对应涝渍胁迫天数的分类概率。

主要研究结果

1. 涝渍胁迫下棉花叶片光谱特征变化规律: 对预处理后的平均光谱曲线分析表明,涝渍胁迫显著改变了棉花叶片的光谱特性。与正常棉株相比,所有经受涝渍胁迫的棉株叶片,其在整个450-950纳米波段范围内的反射率均更高。具体表现为:在550纳米附近的“绿峰”区域,反射率随胁迫天数的增加而升高,10天胁迫组的反射率最高;在670-750纳米的“红边”区域,光谱曲线的起始点和终点均发生“蓝移”现象,即向短波方向移动,且反射率同样随胁迫天数增加而上升;在750-950纳米的反射平台区,涝渍叶片的反射率也普遍高于对照组。这些变化与涝渍胁迫导致叶绿素含量下降、光合作用减弱以及细胞膜可能受损的生理机制相吻合,为利用光谱信息诊断涝渍提供了理论基础。

2. CNN模型分类性能对比: 两个CNN模型在验证集上均取得了极高的分类准确率。具体结果如下: * GlnI-v3模型: 单轮训练平均耗时13.337秒。在验证集上,最终分类准确率达到96.95%,损失值为0.09431。该模型收敛速度较快,仅需约80轮训练(耗时约18分钟)即可使验证准确率达到90%。 * VGG-16模型: 单轮训练平均耗时21.470秒。在验证集上,最终分类准确率为97.00%,损失值为0.17912。但其收敛速度较慢,需要约150轮训练(耗时约54分钟)才能达到90%的准确率。

从混淆矩阵的分析可以看出,两个模型对大多数胁迫天数的分类都非常准确。主要的分类错误发生在8天和10天胁迫的样本之间,存在少量相互误判的情况。这表明长期涝渍胁迫可能使叶片特征趋于相似,增加了模型区分的难度。总体而言,GlnI-v3凭借其Inception模块(可同时使用不同尺寸卷积核并行提取特征)的设计,在保持高精度的同时,获得了更快的训练速度和更低的损失值,综合表现略优于VGG-16。

研究结论与价值

本研究得出以下主要结论: 1. 棉花早期涝渍胁迫会引致叶片光谱反射特征的系统性变化,特别是在绿峰(约550纳米)和红边(670-750纳米)区域,反射率升高与“蓝移”现象可作为识别胁迫及其严重程度(持续时间)的光谱标志。 2. 结合高光谱成像技术、PCA降维以及卷积神经网络,能够实现对棉花不同持续时间涝渍胁迫的高精度、自动化检测。其中,GlnI-v3模型在本任务中表现出更高的效率。 3. 本研究提出的“波段随机丢弃”数据增强策略,有效扩充了高光谱图像数据集,缓解了深度学习模型训练中常见的小样本过拟合问题,为类似研究提供了方法参考。

本研究的科学价值在于,首次系统地将高光谱成像技术与深度学习模型相结合,应用于棉花早期涝渍胁迫的分级(按天数)检测,不仅验证了该技术路线的可行性,还通过严谨的实验揭示了涝渍胁迫的光谱响应规律。在应用价值上,该方法为田间作物胁迫的无损、快速诊断提供了新的技术方案。尽管高光谱设备目前成本较高,但研究揭示的关键响应波段(如550纳米和750纳米附近)为开发成本相对较低的多光谱或定制化传感器用于大田冠层尺度的涝渍监测指明了方向。最终,这项技术有望集成到无人机或地面移动平台上,实现对棉花田块涝渍情况的快速普查与精准评估,为棉花生产的精准管理和灾害损失评估提供强有力的数据支持。

研究亮点

  1. 研究目标精准且具有重要农学意义: 聚焦于棉花生产中的实际痛点——早期涝渍胁迫,致力于实现对其持续时间的精确诊断,直接服务于产量损失预估和田间管理决策。
  2. 技术路线先进且融合性强: 创新性地将高光谱成像(提供丰富、连续的光谱信息)、主成分分析(高效数据压缩与特征提取)与前沿的深度学习模型(强大的特征自学习与分类能力)三者深度融合,构建了一套完整的作物胁迫智能诊断流程。
  3. 方法细节的创新性: 针对高光谱图像样本量有限的问题,提出了“波段随机丢弃”这一贴合高光谱数据特性的数据增强方法,有效提升了模型的泛化能力。
  4. 详实可靠的实验设计: 通过可控的田间模拟试验获取数据,确保了不同胁迫等级样本的真实性与可比性;同时对两个经典CNN模型进行了详细的对比实验,从准确率、损失值、收敛速度等多维度评估了其性能,结论可靠。
  5. 良好的可扩展性与启示性: 研究成果不仅证明了该方法对棉花涝渍检测的有效性,其技术框架也可迁移至其他作物或其他类型的生物/非生物胁迫检测中。研究中对关键光谱波段的发现,为开发实用化、低成本的多光谱监测设备奠定了理论基础。
上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com