分享自:

用于嵌入式系统的轻量级深度学习模型高效预测油菜籽含油量与蛋白质含量

期刊:food chemistryDOI:10.1016/j.foodchem.2025.143557

这篇题为《面向嵌入式系统的轻量级深度学习模型高效预测油菜籽含油量与蛋白质含量》的研究论文,发表于《食品化学》(Food Chemistry)期刊2025年第477卷。该研究由中国农业科学院油料作物研究所、湖北省洪山实验室以及中国热带农业科学院农产品加工研究所的研究人员共同完成,第一作者为Mengshuai Guo,通讯作者为Fang Wei。

一、 学术背景

油菜籽是全球重要的油料作物,其经济价值和工业应用主要取决于两大关键指标:含油量和蛋白质含量。传统化学检测方法,如索氏提取和凯氏定氮法,不仅耗时耗力、成本高昂,而且具有破坏性,难以满足现代农业生产对高通量、低成本、绿色无损检测技术的迫切需求。近年来,近红外光谱(NIR)和高光谱成像(HSI)结合机器学习算法在品质预测方面取得了进展,但这些方法依赖于昂贵的设备,且数据处理复杂。

计算机视觉与深度学习技术的结合,为农产品品质快速无损检测提供了新的可能。它通过分析图像或视频,自动提取特征,避免了传统机器学习方法依赖人工特征提取的局限。尽管已有研究利用计算机视觉进行油菜品种分类或总酚含量预测,但基于此技术预测油菜籽核心品质成分——含油量和蛋白质含量的研究仍然有限。因此,本研究旨在开发一种基于计算机视觉和深度学习的新型方法,以实现对油菜籽含油量和蛋白质含量的低成本、无损、实时预测,并最终将优化后的轻量级模型部署到嵌入式系统(特别是智能手机)上,为快速在线检测提供技术解决方案。

二、 详细工作流程

本研究的工作流程系统而完整,涵盖了从样本采集、模型构建、优化到最终应用的全过程。

1. 样本获取与成分测定: 研究人员从中国八个省份收集了具有代表性的油菜籽品种,共268个样本。每个样本的含油量和蛋白质含量均依据中国国家标准(GB5009.6–2016和GB5009.5–2016)采用化学方法进行精确测定,作为模型训练的“真实值”标签。数据显示,样品蛋白质含量在17.48%至27.83%之间,含油量在34.06%至50.27%之间,具有足够的变异性,为训练一个具有良好泛化能力的模型奠定了基础。

2. 图像采集与预处理: 研究团队使用了一套自主设计的计算机视觉系统进行图像采集。该系统核心为一个不透光的暗箱,内置高清CCD工业相机和环形LED光源,确保所有图像在标准化的光照和相机参数下获取。每个油菜籽样本采集20张图像,并在每次拍摄时旋转样本以获取全面的信息。最终,共获得22,512张独特的油菜籽图像,并统一处理为680×680像素的分辨率。 数据集被随机划分为训练集、验证集和测试集,比例为8:1:1。为防止模型过拟合,提升其泛化能力,研究对训练集图像应用了翻转、亮度调整、添加噪声和色调变换等数据增强技术。化学成分数据与图像一一对应,构成了本研究所用的“油料作物数据集”。

3. 深度学习模型的选择与评估: 研究选择了七种具有代表性的深度学习模型进行性能评估,涵盖了卷积神经网络(CNN)和Transformer两大类主流架构,以探索不同复杂度模型在特定任务上的表现。CNN架构的模型包括:FasterNet-L、VGGNet19、ResNet18、EfficientNet-B7和VanillaNet-13。Transformer架构的模型包括:MPViT-B和SwinTransformerV2-L(SwinV2-L)。所有模型均基于PyTorch框架进行训练,采用均方误差(MSE)作为损失函数,Adam作为优化器,统一训练500轮,批次大小为12,学习率为0.00001。模型性能通过多个指标进行评估,包括决定系数(R²)、预测均方根误差(RMSEP)、平均绝对误差(MAE)和残差预测偏差(RPD)。

4. 模型性能分析与选择: 在所有评估模型中,基于Transformer的SwinV2-L和基于CNN的FasterNet-L表现最为出色。在测试集上,SwinV2-L对含油量和蛋白质含量的预测决定系数(Rp²)分别达到0.9366和0.8974,RMSEP分别为0.6822和0.6079。FasterNet-L的相应指标为Rp²:0.9336(油)和0.8828(蛋白),RMSEP:0.6982和0.6498。尽管SwinV2-L在预测精度上略优,但其模型参数更多、计算复杂度更高,在测试集上的预测耗时(9.5669秒)显著长于FasterNet-L(6.9236秒)。 考虑到本研究的最终目标是将模型部署到计算资源有限的移动嵌入式设备上,研究选择了在性能与效率之间取得最佳平衡的FasterNet-L作为基础模型。其预测含油量和蛋白质含量的RPD值分别达到3.88和2.92(RPD值大于2.5通常被认为具有优秀的预测能力和实际应用潜力),表明该模型具有良好的泛化能力。

5. 模型剪枝优化: 为了进一步压缩模型大小、降低计算需求,以更适合移动端部署,研究对选定的FasterNet-L模型应用了三种剪枝方法进行优化:L1范数剪枝、基于梯度的剪枝以及基于生长正则化的神经剪枝。研究以未经剪枝的FasterNet-L为基线进行对比。 结果显示,基于生长正则化的神经剪枝方法效果最优。经过此方法优化后,模型在预测精度上仅受到微小影响(含油量和蛋白质的Rp²分别仅下降2.27%和2.55%),但同时取得了显著的效率提升:模型预测速度提升了13.18%(测试时间从6.9236秒缩短至6.0110秒),模型大小减小了15.79%(从352.1 MB降至296.5 MB),浮点运算次数(FLOPs)减少了10.25%(从15.558 G降至13.963 G)。这证明了该剪枝方法在有效压缩模型、提升推理速度的同时,能够最大程度地保持模型的预测性能。

6. 移动端应用部署与验证: 研究使用“torch.jit.trace”函数将优化后的FasterNet-L模型转换为可在移动设备上运行的TorchScript格式(文件名为“fasternet_mobile.pt”)。通过Android Studio开发环境,成功将该模型部署到Android智能手机上,构建了一款用户友好的应用程序。在应用界面中,用户可以选择相册中的油菜籽图像,并选择FasterNet-L等模型进行预测,结果通常在2-3秒内显示并可保存至本地数据库。 为验证移动端部署的可靠性,研究进行了跨平台一致性测试和实际样本验证。跨平台测试表明,同一张图像在个人电脑(PC)和手机应用上使用相同模型的预测结果仅有微小差异,证明了部署的有效性。此外,研究人员选取了6个未参与模型训练的全新油菜籽样本,同时进行化学检测和手机应用预测。对比结果显示,预测值与真实值之间存在一定误差(蛋白质和含油量的平均绝对误差MAE分别为1.34和2.23),对于部分样本预测效果良好,但对于另一些样本则偏差较大。这提示模型的泛化能力仍有提升空间,未来可能需要通过调整超参数、优化训练算法、增加训练样本的多样性和代表性来进一步改进。

三、 主要结果及其逻辑关系

研究结果呈现了清晰的递进逻辑。首先,通过对七种模型的系统评估,发现SwinV2-L和FasterNet-L在预测精度上显著优于其他模型,验证了深度学习方法用于油菜籽成分预测的可行性。这构成了后续研究的基础。 其次,在比较精度和计算效率后,研究因移动部署的资源限制而选择了FasterNet-L,这引出了下一个关键问题:如何让这个已表现优异的模型变得更小、更快?于是,模型剪枝成为必要步骤。剪枝实验的结果表明,基于生长正则化的神经剪枝是最有效的方法,它成功地在可接受的精度损失范围内,显著压缩了模型体积并提升了推理速度,使模型真正具备了在资源受限的嵌入式设备上高效运行的条件。 最后,模型剪枝优化的成功为最终的应用部署铺平了道路。移动应用的成功开发与部署,以及初步的实地验证,证明了整个技术路线——从图像采集、深度学习建模、模型优化到移动端部署——的完整性和实用性。虽然对新样本的预测存在误差,但这并非否定整个方法,而是指出了模型未来迭代和优化的具体方向。实验结果环环相扣,从“验证方法有效性”到“优化模型适配性”,最终实现“完成技术落地”,形成了一个完整的研究闭环。

四、 研究结论与意义

本研究的核心结论是,成功开发了一种基于计算机视觉和优化深度学习模型(FasterNet-L)的低成本、无损、实时方法来预测油菜籽的含油量和蛋白质含量。该方法利用智能手机拍摄的油菜籽图像即可快速给出预测值,为实现田间或生产现场的快速品质筛查提供了强大的技术工具。 其科学价值在于,首次系统地将轻量级深度学习模型与计算机视觉结合,并应用于油菜籽两大核心品质成分的同步预测,拓展了深度学习在农业食品无损检测领域的应用边界。研究详细比较了不同架构模型的性能,并验证了基于生长正则化的神经剪枝在模型压缩中的有效性,为相关领域的模型优化和移动端部署提供了可借鉴的方法论。 其实用价值非常突出。所开发的移动应用程序操作简便、预测快速,极大地降低了检测门槛和设备成本,有望替代或辅助传统的实验室化学分析方法,服务于育种筛选、收购定价、加工过程控制等多个环节,提升整个油菜产业链的效率和智能化水平。论文最后指出,该方法具备扩展到其他油料作物进行快速品质鉴定的潜力,显示了其广泛的应用前景。

五、 研究亮点

  1. 首创性应用:首次系统地将轻量级深度学习模型与计算机视觉技术结合,实现了对油菜籽含油量和蛋白质含量的同步、快速、无损预测,并完成了从实验室模型到移动端应用程序的全流程开发与部署。
  2. 详尽的模型对比与优选:研究没有局限于单一模型,而是全面评估了七种主流CNN和Transformer模型,为特定任务下的模型选择提供了详实的实验依据,并最终基于“性能-效率”平衡原则选择了最适合移动部署的FasterNet-L。
  3. 有效的模型轻量化策略:成功应用并比较了多种模型剪枝技术,其中基于生长正则化的神经剪枝被证明能显著提升模型在嵌入式设备上的推理效率(速度提升13.18%,体积减小15.79%),同时将精度损失控制在极低水平,为解决深度学习模型在资源受限环境下的部署难题提供了有效方案。
  4. 完整的技术闭环与实用导向:研究不仅仅停留在算法层面,而是构建了包含数据采集、模型训练、优化压缩、移动部署和初步实地验证的完整技术体系,体现了强烈的应用导向,其成果可直接转化为方便易用的生产力工具。

六、 其他有价值的内容

研究在讨论部分客观分析了模型的局限性。在对全新样本的预测测试中,模型表现出现波动,这表明当前的模型泛化能力仍有提升空间。研究人员将此归因于样本特征多样性、图像质量、拍摄条件等因素,并明确指出未来需要通过调整超参数、改进训练算法、以及最重要的是增加未来训练样本的多样性和代表性来加以改善。这种对模型局限性的坦诚分析和对未来改进方向的清晰规划,增强了研究的严谨性和科学性。此外,论文提供了丰富的补充材料,包括样本信息表、模型参数表、系统示意图、数据集构成及核心代码图示等,确保了研究的可重复性和透明度。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com