基于轻量级神经网络MobileNetV3-Small的鲈鱼摄食状态分类

分享自：
基于轻量级神经网络MobileNetV3-Small的鲈鱼摄食状态分类

期刊:农业工程学报DOI:10.11975/j.issn.1002-6819.2021.19.019
基于轻量级神经网络MobileNetV3-small的鲈鱼摄食状态分类研究学术报告
本研究由华中农业大学工学院的朱明、张镇府、黄凰（※通信作者）、陈燕燕、刘亚东、董涛共同完成，合作单位还包括农业农村部长江中下游农业装备重点实验室以及长江经济带大宗水生生物产业绿色发展教育部工程研究中心。该研究成果以题为《基于轻量级神经网络mobilenetv3-small的鲈鱼摄食状态分类》发表于《农业工程学报》（Transactions of the Chinese Society of Agricultural Engineering）2021年第37卷第19期。
一、 学术背景与研究目的 本研究属于智慧水产养殖与农业信息技术的交叉领域，具体聚焦于利用机器视觉与深度学习技术实现养殖鱼类的精准投喂。在集约化水产养殖中，饲料成本占总成本的40%-80%，但传统的人工或机械投喂方式依赖经验，易造成投喂过量（导致浪费与水污染）或不足（影响生长并可能引发争斗）。因此，实现基于鱼类实时摄食状态的“适时适量”智能投喂，对于控制成本、提高效率、减少污染具有重要意义。尽管已有研究利用计算机视觉、近红外成像、传统机器学习（如SVM）乃至深度学习（如CNN、YOLO）技术监测鱼群行为或评估摄食强度，但多数应用于实验室环境。室外集约化养殖环境复杂多变，且适用于此环境的移动或嵌入式设备计算能力有限，这为实时、高效的智能投喂系统开发带来了挑战。针对此问题，本研究旨在探索一种适用于室外移动设备的轻量级、高精度的鲈鱼摄食状态分类方法，并验证其在真实养殖环境下的投喂决策效果，最终目标是为室外集约化养殖的高效智能投喂提供切实可行的技术参考。
二、 详细研究流程 本研究流程系统且完整，主要包含数据采集与处理、模型构建与训练、模型对比验证、以及实际投喂试验四个核心环节。
第一环节：数据采集与数据集构建。 研究在华中农业大学水产学院实践教学基地的“零排放圈养系统”中进行。研究对象为已适应环境的“优鲈1号”大口黑鲈。研究团队搭建了视频采集平台，将防水摄像机固定于圈养塘上方约2.5米处，通过4G网络传输视频数据。采集期间，由养殖人员进行饱食投喂，饲料为浮性膨化饲料。通过预试验观察发现，每轮投喂（500g）后，初始阶段鱼群抢食激烈、水花多，不利于观察；而在进食末期（约第80-110秒），水面趋于稳定，剩余饲料情况更清晰，便于判断摄食状态。因此，研究团队随机统计了7天内的鲈鱼每轮进食时间，计算出平均进食时间为94秒，并最终确定采集每轮投喂结束后第80至110秒的视频图像作为数据源。
数据处理方面，首先从选定时间段的视频中每隔1秒提取一帧图像，并裁剪出能反映鱼群进食和饵料状况的主要区域，得到512×512像素的图片。根据第90秒左右的鲈鱼食欲程度，研究者将状态划分为四个等级：“强”（水面无鱼无饲料，进食完毕）、“中”（剩余饲料估算质量<100g）、“弱”（剩余饲料>100g）、“无”（有饲料但无鱼进食）。为简化决策，将“强”和“中”合并为“饥饿”类别，“弱”和“无”合并为“非饥饿”类别，从而构建了一个二分类问题数据集。最终，从原始视频中随机选取了10,000张代表性图片（“饥饿”与“非饥饿”各5,000张），并按6:2:2的比例划分为训练集、验证集和测试集。
为了提升模型在多变室外环境（如不同光照的晴天、阴天、小雨）下的泛化能力，研究对训练集进行了系统的离线数据增强。增强手段包括：随机翻转、随机裁剪、添加高斯噪声（均值0，方差0.001），以及色彩抖动（随机调整饱和度、亮度和对比度）。经过增强，训练集图片数量扩充至12,000张（每类6,000张）。
第二环节：模型构建与训练。 本研究核心是采用轻量级神经网络MobileNetV3-small作为分类模型。该模型专为移动和嵌入式设备设计，结合了深度可分离卷积、逆残差结构、以及轻量级注意力模块（Squeeze-and-Excitation, SE），在保证精度的同时大幅减少了计算量和参数。模型输入为512×512×3的RGB图像，经过一系列卷积和块（Block）操作后，通过全局平均池化（Global Average Pooling）和全连接层输出“饥饿”与“非饥饿”两个类别的概率。模型使用TensorFlow 2框架搭建，在训练时设置批大小（Batch Size）为16，学习率为0.0001，使用Adam优化器，共迭代50个周期（Epochs）。训练过程显示，模型在约10个周期后接近收敛，最终在验证集上的准确率达到99.7%。
第三环节：模型性能对比验证。 为了全面评估所选模型的优越性，研究设计了与多种模型的对比实验。 1. 与传统机器学习模型对比：选取了K近邻（K-Nearest Neighbors, KNN）、支持向量机（Support Vector Machine, SVM）、梯度提升决策树（Gradient Boosting Decision Tree, GBDT）以及基于前三者的Stacking集成学习模型。这些模型使用从图像中人工提取的纹理、颜色、形状等共28组特征，并经过特征工程筛选出6组关键特征进行训练。 2. 与其他深度学习模型对比：选取了ResNet-18、轻量级网络ShuffleNetV2以及MobileNetV3-large进行对比。所有深度学习模型使用相同的数据集和训练参数（批大小16，学习率0.0001，迭代50次）。 评估指标包括准确率（Accuracy）、召回率（Recall）、精准率（Precision）、F1分数（F1 Score）、模型计算量（Floating Point Operations, FLOPs）和平均分类速率（帧/秒）。
第四环节：室外真实环境投喂对比试验。 为验证模型的实际应用效果，研究团队在真实养殖池塘进行了为期14天的对比试验。设置3号塘为试验组（模型决策投喂），6号塘为对照组（人工经验投喂），两塘养殖环境基本一致。试验采用“单场多轮”投喂方式，每轮投喂量固定为500g。 试验组的投喂决策流程是本研究的一个创新应用点：在每轮投喂后的第90、92、94、96、98秒，连续采集5帧图像输入训练好的MobileNetV3-small模型进行分类。若5帧图中被预测为“饥饿”的帧数占比≥60%，则立即进行下一轮投喂；否则，等待50秒后再次采集5帧图像进行决策，若结果仍为“非饥饿”，则终止本场投喂。这种基于多帧图像的投票决策机制，有效降低了单帧图像误判带来的决策风险。试验以饵料系数（Feed Conversion Ratio, FCR）和质量增加率（Weight Gain Ratio, WGR）作为衡量养殖效果的关键指标。
三、 主要研究结果 1. 模型在测试集上的性能： 训练完成的MobileNetV3-small模型在独立测试集上取得了优异的表现：准确率99.60%，召回率99.40%，精准率99.80%，F1分数99.60%。这表明该模型能够非常准确地区分鲈鱼的“饥饿”与“非饥饿”状态。
2. 模型对比结果： * 与传统机器学习模型相比：MobileNetV3-small的准确率显著高于传统方法，分别比KNN、SVM、GBDT和Stacking高出12.74、23.85、3.60和2.78个百分点。这证实了在复杂多变的室外场景下，深度学习模型自动学习特征的能力远优于人工设计特征的方法。 * 与其他深度学习模型相比：四款深度学习模型（ResNet-18, ShuffleNetV2, MobileNetV3-large, MobileNetV3-small）的分类精度指标（准确率、召回率等）相近且都处于很高水平（均>98.95%），说明它们都能有效完成分类任务。然而，在面向移动设备部署的关键指标——计算效率上，MobileNetV3-small展现出绝对优势：其计算量（FLOPs）仅为582 M，是对比模型中最低的（ShuffleNetV2为1507 M，是其2.6倍）；其平均分类速率达到39.21帧/秒，是对比模型中最高的（ShuffleNetV2为29.67帧/秒）。这完美契合了室外移动设备计算能力有限的应用需求，证明了选择MobileNetV3-small的合理性和优越性。
3. 实际投喂试验结果： 经过14天的对比试验，基于MobileNetV3-small模型决策的试验组取得了更优的养殖效果： * 饵料系数（FCR）：试验组为1.42，对照组为2.72。试验组的饵料系数仅为对照组的52.20%，这意味着试验组增加单位鱼产量所消耗的饲料更少，饲料利用率显著提高。 * 质量增加率（WGR）：试验组为5.56%，对照组为2.88%。试验组的鲈鱼生长速率更高，质量增加率提升了2.68个百分点。 此外，试验期间试验组池塘的水质参数（pH值、氨氮）均处于国家渔业水质标准合理范围内，说明智能投喂并未导致水质恶化。这些结果强有力地证明，基于该分类模型的投喂决策系统不仅能节约饲料成本，还能促进鱼类生长，在实际养殖中具有替代人工经验决策的潜力。
四、 研究结论与价值 本研究成功提出并验证了一种基于轻量级神经网络MobileNetV3-small的圈养鲈鱼摄食状态分类方法。该方法针对室外集约化养殖环境复杂、移动设备算力有限的特点，通过构建高质量的图像数据集、采用高效的轻量级网络模型，实现了对鲈鱼饥饿状态的高精度（99.60%）、高效率（39.21帧/秒）实时分类。进一步的实地投喂对比试验表明，依据该模型决策的投喂策略，能够显著降低饵料系数（1.42 vs 2.72）并提高鲈鱼质量增加率（5.56% vs 2.88%）。 本研究的科学价值在于，将先进的轻量级深度学习模型与水产养殖的实际需求紧密结合，为解决室外复杂环境下基于视觉的智能投喂难题提供了一个高效、可行的技术方案。其应用价值突出体现在：为开发适用于户外场景、部署在移动或嵌入式设备上的智能投喂系统提供了核心算法支持，有助于推动水产养殖向精准化、自动化、智能化方向发展，对于降低养殖成本、提高经济效益、减少环境污染具有重要的现实意义。
五、 研究亮点 1. 问题导向明确，场景贴合实际：直接针对“室外集约化养殖环境”和“移动设备计算能力弱”这两个实际应用中的核心挑战展开研究，具有很强的现实针对性。 2. 数据构建科学合理：通过观察鲈鱼进食规律，科学地选取每轮投喂后第80-110秒的相对稳定期图像构建数据集，并依据摄食强度划分为“饥饿/非饥饿”二分类，简化了决策逻辑，提升了模型的实用性。 3. 模型选型与验证充分：不仅证明了MobileNetV3-small模型的高精度，更重要的是通过详尽的对比实验（包括与传统机器学习、其他深度学习模型的对比），从计算量（FLOPs）和推理速度（帧率）两个关键维度，论证了其在资源受限环境下部署的显著优势。 4. “模型-系统-验证”闭环完整：研究超越了单纯的算法性能测试，设计了完整的室外实地投喂对比试验，创新性地采用了“多帧图像投票决策”机制，并以饵料系数和质量增加率这两个关键生产指标客观评估了模型应用的实际效果，形成了从技术研发到应用验证的完整闭环，结论非常扎实。 5. 细节处理增强泛化：采用了包括色彩抖动在内的多种数据增强手段，有效提升了模型对不同天气（光照）条件的适应能力，增强了其在真实多变环境下的鲁棒性。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问