DGHr-YOLO：基于高层筛选特征金字塔网络和可变形卷积的织物缺陷检测

分享自：
DGHr-YOLO：基于高层筛选特征金字塔网络和可变形卷积的织物缺陷检测

工程学
机械
信息科学
人工智能
计算机科学
期刊:Nondestructive Testing and EvaluationDOI:10.1080/10589759.2025.2451768
【点击此处】阅读全文、收藏及针对性提问
关于DGHr-YOLO织物疵点检测模型的学术研究报告
一、 作者、机构与发表信息
本研究的主要作者为Zhixing Zhang, Tongyuan Huang, Weifeng Zhang, Yihan Yang 和 Qianjiang Yu，他们均来自重庆理工大学人工智能学院。该项研究成果以题为《DGHr-YOLO: fabric defect detection based on high-level screening -feature pyramid networks and deformable convolution》的论文形式，发表于学术期刊 Nondestructive Testing and Evaluation（2025年，第40卷第12期，页码5919-5944）。论文于2025年1月11日在线发表，DOI号为10.1080⁄10589759.2025.2451768。
二、 研究背景与目的
本研究属于计算机视觉与人工智能在工业无损检测领域的交叉应用，具体聚焦于织物疵点自动检测这一关键工业质量控制环节。织物是日常生活必需品和现代工业的重要组成部分，其生产过程中的自动化不可避免地会产生各类疵点。传统的人工检测方法效率低下且高度依赖操作员的经验与专注力。而传统的基于机器视觉的方法通常依赖于手工设计的特征（如纹理、颜色、形状），在复杂场景和多样疵点类型下泛化能力不足，覆盖范围有限。
随着深度学习技术的发展，基于深度学习的缺陷检测方法因其强大的泛化能力和适应性而受到广泛关注。在织物检测领域，尽管已有大量改进算法被提出（如SE-YOLOv5、FD-YOLOv5、YOLO-SCD等），但它们仍面临一系列挑战：首先，织物疵点形态复杂、尺度多变，且常与织物背景高度融合，导致特征与目标尺度不平衡，现有方法性能提升往往局限于特定疵点类型。其次，许多现有轻量级模型在降低计算负担方面虽有进展，但精度提升有限，且能检测的疵点类型覆盖范围较窄，难以满足实际工业生产环境对高效率、高精度、多类型检测的综合需求。
因此，本研究旨在提出一种新型高效的织物疵点检测模型——DGHr-YOLO，其核心目标是：在保持模型轻量化的同时，显著提升对多尺度、多形态织物疵点的检测精度，并扩大可检测疵点的类型范围，以更好地平衡检测精度、模型参数量、计算复杂度和实际应用需求。
三、 研究详细工作流程
本研究的工作流程主要包括数据集准备、模型设计与集成、实验设置与训练、以及性能评估与对比分析四个主要环节。
第一环节：数据集准备与预处理。 研究使用的数据集来源于阿里巴巴云天池平台的“广东工业制造大赛”，包含5096张高分辨率（2446×1000像素）的织物疵点图像。考虑到实际制造环境的多样性，研究保留了大部分疵点类别，仅剔除了数据量极少的类别，最终构建了一个包含12类疵点的新数据集，包括：孔洞（Hole）、污渍（Stain）、三丝（Three Filaments）、结头（Knotted Head）、百脚（Hundred Feet）、粗节（Grain）、断经（Broken Warp）、浆斑（Pulp Spot）、擦伤痕（Abrasion Mark）、经结（Warp Knot）、密路（Dense File）和松经（Loose Warp）。由于原始图像分辨率高，小目标疵点特征提取困难，研究采用滑动窗口裁剪技术对数据集进行增强。设置滑动窗口步长为100像素，裁剪图像尺寸标准化为640×640像素。经过裁剪，数据集从5096张原始图像扩充至14269张裁剪后图像，有效增加了样本数量并减少了冗余信息。最后，将数据集按7:2:1的比例划分为训练集、测试集和验证集，分别用于模型训练、测试和性能评估。
第二环节：DGHr-YOLO模型设计与核心模块开发。 本研究在YOLOv8m模型的基础上，进行了四项核心创新，构建了DGHr-YOLO模型架构。 1. 可变形卷积块（Deformable Convolution Block, DCB）的引入：针对传统卷积固定采样网格难以适应疵点不规则形状和尺度变化的问题，研究将可变形卷积（DCNv2）集成到骨干网络的高层。DCB通过引入可学习的偏移量，使卷积核的采样点能够根据输入特征内容动态调整位置，从而自适应地贴合疵点的实际形态，更精确地提取复杂疵点的细粒度特征，尤其增强了模型对高层语义特征图中复杂变形特征的捕获能力。 2. GS-SPPF模块的提出：为了缓解特征变换过程中的语义信息丢失并优化特征融合，研究提出了GS-SPPF模块。该模块的核心是用GSConv替换了原SPPF结构中的1×1标准卷积层。GSConv是一种轻量高效的卷积操作，它结合了通道密集卷积和深度可分离卷积（DWConv）的优点，并通过通道混洗（Shuffle）操作，将标准卷积提取的特征充分混合到深度可分离卷积的输出中。这种方式在最小化计算开销的同时，最大程度地保留了通道间的隐式连接和特征完整性，增强了模型对细微疵点特征的捕捉能力，并提升了推理速度。 3. 高层筛选特征金字塔网络（High-level Screening Feature Pyramid Networks, HS-FPN）的设计：为了有效处理疵点的多尺度特性并降低模型复杂度，研究设计了一个轻量级的HS-FPN结构来替代原模型的颈部网络。HS-FPN包含两个关键子模块：特征选择模块和特征融合模块。特征选择模块利用通道注意力（Channel Attention, CA）机制为不同尺度的低级特征图生成通道权重，过滤掉不相关的低级特征，突出重要通道信息。特征融合模块则通过转置卷积和双线性插值对高级特征进行上采样，然后使用CA机制增强后的高级特征与筛选后的低级特征进行相加融合，实现高层语义向低层特征的传递。最后，通过引入RCS-OSA模块进行深度跨尺度特征融合。HS-FPN显著降低了参数量，并增强了模型的多尺度特征表示能力。 4. 基于通道混洗与重参数化卷积的单发聚合模块（RCS-OSA）的集成：为了提升多尺度特征融合的效率和速度，研究提出了RCS-OSA模块以替代原有的C2f模块。该模块由RCS（基于通道混洗的重参数化卷积）和OSA（单发聚合）两部分组成。RCS模块通过通道分割、通道混洗和结构重参数化技术，优化了卷积操作，在增强多尺度特征交互的同时，显著降低了计算复杂度和内存消耗。OSA模块则采用单发聚合策略，将不同尺度的特征一步聚合到最终特征图中，避免了传统多阶段融合的计算冗余，大幅提升了推理效率。RCS-OSA的堆叠使用进一步增强了模型捕获多层次缺陷特征的能力。
第三环节：实验参数设置与模型训练。 实验在基于i7-13700K CPU、GeForce RTX 4090 GPU和Windows 11操作系统的硬件平台上进行。使用Python 3.8和PyTorch 1.9框架构建网络模型，CUDA版本为12.0。模型输入图像尺寸设置为640×640，初始学习率为0.01，批次大小（Batch Size）为16，优化器采用随机梯度下降（SGD），权重衰减为0.0005，动量为0.937。整个训练过程共进行1200个周期（Epochs）。
第四环节：性能评估与数据分析流程。 研究采用多种指标综合评价模型性能，包括：精确率（Precision, P）、召回率（Recall, R）、平均精度（Average Precision, AP）、平均精度均值（mean Average Precision, mAP，包括IoU阈值为0.5的mAP@0.5和IoU阈值从0.5到0.95间隔0.05的平均值mAP@0.5:0.95）、F1分数、模型参数量（Params）、浮点运算次数（FLOPs）和推理速度（FPS）。通过绘制精确率-召回率曲线并计算其下面积来得到AP值。研究首先进行了系统的消融实验，逐步添加DCB、GS-SPPF、HS-FPN和RCS-OSA模块，以评估每个模块对模型性能的独立贡献。随后，将完整的DGHr-YOLO模型与多个主流YOLO版本（YOLOv5m, YOLOv6, YOLOv7l, YOLOv8m, YOLOv9m, YOLOv10m）以及其他先进的织物疵点检测方法（如YOLO-SCD, FD-YOLOv5, PEI-YOLOv5等）进行对比实验。此外，还提供了模型在不同疵点类别上的F1分数对比以及检测结果的可视化（包括原图、检测输出和热力图），以直观展示其性能。
四、 主要研究结果
消融实验结果清晰地展示了各个模块的贡献。以YOLOv8m作为基线模型（mAP@0.5: 83.1%, mAP@0.5:0.95: 68.9%, Params: 25.8M, FLOPs: 78.7G）。依次引入各模块后：加入DCB模块，mAP@0.5提升至84.0%，FLOPs降至75.6G，证明了动态采样对提升特征提取能力的有效性。加入GS-SPPF模块后，mAP@0.5进一步提升至84.7%，参数量降至25.6M，FLOPs降至75.3G，表明该模块在优化特征融合、减少信息丢失方面的作用。加入HS-FPN模块后，mAP@0.5达到85.1%，同时参数量大幅减少至16.5M，FLOPs显著降低至62.4G，凸显了其高效的特征选择与融合能力以及强大的轻量化效果。最终，引入RCS-OSA模块构成完整的DGHr-YOLO模型，取得了最佳性能：mAP@0.5达到85.8%，mAP@0.5:0.95达到72.7%，参数量为20.9M，FLOPs为75.8G。消融实验结果表明，每个模块都对最终性能有正向提升，共同实现了精度与效率的平衡。
与主流YOLO模型的对比结果显示，DGHr-YOLO在综合性能上表现优异。在Tianchi织物数据集上，其mAP@0.5（85.8%）和mAP@0.5:0.95（72.7%）均优于所有对比的YOLO版本。特别是在更严格的mAP@0.5:0.95指标上，相比基线YOLOv8m提升了3.8%。模型的精确率（P）达到92.5%，为所有对比方法中最高，表明其误检率低。召回率（R）为79.2%，显著高于YOLOv6（67.9%）和YOLOv7l（68.6%），说明漏检较少。在模型复杂度方面，20.9M的参数量远低于YOLOv6（51M）和YOLOv7l（36.5M）。推理速度达到185 FPS，接近YOLOv8m（189 FPS）和YOLOv10m（217 FPS），在保证高精度的同时满足了实时性要求。
与先进织物检测方法的对比结果进一步证实了DGHr-YOLO的优势。在检测12类疵点的任务中，DGHr-YOLO在大多数类别（如H, TF, KH, HF, G等）上取得了最高的AP值或具有竞争力的F1分数。例如，在“孔洞（H）”这类常见疵点上AP达到95.6%，在“三丝（TF）”、“结头（KH）”等小目标上表现突出。虽然其mAP@0.5（85.8%）略低于PEI-YOLOv5（87.89%），但后者仅能检测5类疵点，而DGHr-YOLO覆盖了12类，展现了更广的泛化能力。在参数量上，DGHr-YOLO（20.9M）远低于YOLO-SCD（36.7M）。在推理速度上，185 FPS远超YOLO-SCD（46 FPS）和Cai‘s方法（35.4 FPS），体现了其在实际工业部署中的高效性。
可视化结果（图10）直观展示了DGHr-YOLO模型能够准确检测出多尺度、多种类的织物疵点，热力图显示了模型对疵点区域的关注度较高，验证了其有效性。
五、 研究结论与价值
本研究成功提出并验证了一种名为DGHr-YOLO的新型织物疵点检测模型。该模型通过集成可变形卷积块（DCB）、GS-SPPF模块、高层筛选特征金字塔网络（HS-FPN）和基于通道混洗与重参数化卷积的单发聚合模块（RCS-OSA），有效地解决了织物疵点检测中目标形态多变、尺度不一、与背景融合度高以及模型精度与效率难以兼顾的挑战。
科学价值：本研究为基于深度学习的工业视觉检测提供了一种创新的模型架构设计思路。DCB的引入增强了CNN模型对不规则几何形状特征的适应能力；GS-SPPF为轻量化设计下的特征保留与融合提供了新方案；HS-FPN展示了一种高效的多尺度特征选择与融合机制；RCS-OSA则为提升实时检测模型的多尺度特征交互与推理效率提供了有效途径。这些模块的协同工作，为处理类似具有复杂形态和尺度变化的目标检测问题提供了可借鉴的框架。
应用价值：实验结果表明，DGHr-YOLO在保持较低参数量和计算复杂度的同时，显著提升了检测精度（特别是mAP@0.5:0.95）和推理速度，并且能够检测更广泛的疵点类型。这使其非常适合于在计算资源有限的边缘设备或嵌入式系统上进行部署，满足纺织工业生产线对实时、高精度、自动化疵点检测的迫切需求，有助于提升产品质量控制水平和生产效率，推动纺织制造业的智能化升级。
六、 研究亮点
多模块协同的创新架构：研究并非单一技术的改进，而是通过DCB、GS-SPPF、HS-FPN、RCS-OSA四个核心模块的有机组合，系统性地从特征提取、特征融合、多尺度处理、计算效率等多个维度对模型进行优化，形成了完整的性能提升链条。
精度与轻量化的卓越平衡：在显著提升检测精度（mAP@0.5提升2.7%，mAP@0.5:0.95提升3.8%）的同时，通过HS-FPN等设计大幅降低了模型参数量，并通过RCS-OSA等优化保持了高速推理能力，实现了精度、速度、模型大小三者之间的优异权衡。
针对工业场景的实用化设计：模型设计充分考虑了工业部署的实际约束（如计算资源、实时性要求），所提出的模块如GSConv、重参数化卷积、通道注意力筛选等都具有明确的轻量化和加速导向。在涵盖12类疵点的更具挑战性和实用性的数据集上验证了模型性能，证明了其广泛的适用性。
对细小及不规则疵点的检测能力增强：通过DCB适应不规则形状，通过HS-FPN加强多尺度（尤其是小尺度）特征融合，使得模型在“三丝”、“结头”等小目标和形态复杂疵点上的检测表现突出。
七、 其他有价值内容
研究也坦诚指出了模型的局限性：对于某些与织物背景高度融合的疵点（如断经、浆斑），检测性能仍有提升空间；此外，由于数据量不足，一些罕见疵点类型未被纳入检测范围。针对这些不足，作者提出了未来的改进方向：将通过在线增强模块强化对特征不明显疵点的表征；利用少样本学习策略扩展模型可检测的疵点类型范围；并从系统工程角度，计划将模型集成到统一的框架中，在实际工业检测环境中进行部署和评估，以进一步提升其工程可行性和可扩展性。这种对自身工作局限性的客观分析以及对未来工作的规划，体现了研究的严谨性和前瞻性。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问