分享自:

基于深度学习的民用基础设施裂缝检测与分割方法综述

期刊:IEEEDOI:10.1109/icoeit.2025.17

根据文档内容判断,该文档属于类型b:一篇系统性的综述论文。以下是为中文读者撰写的学术报告。


《基于深度学习的土木基础设施裂缝检测与分割方法综述》 这篇论文的作者是来自印度博帕尔国立技术学院计算机科学系的Geeta Anilrao Pathrikar、Jyoti Bharti和Bholanath Roy。该综述发表于2025年电气与电子工程师学会举办的“国际工程创新与技术会议”,并收录于IEEE会议论文集。

论文的核心主题是系统回顾并分析近年来深度学习技术在土木工程结构健康监测领域,特别是裂缝自动检测与图像分割方面的应用进展、主流模型、面临的挑战及未来方向。文章旨在为研究者和工程师提供一个全面的技术概览,促进该领域从理论研究向实际工程部署的转化。综述的结构清晰,主要围绕以下几个核心观点展开论述:

第一个核心观点是:传统裂缝检测方法存在固有局限性,而深度学习技术为实现自动化、高精度的检测方案带来了革命性突破。 文章开篇即指出,裂缝检测与分割是保障土木基础设施安全与耐久性的结构健康监测的关键环节。传统方法主要依赖于专业人员的人工目视检查,这种方法被明确指出是劳动密集型的、主观性强且容易出错。为了克服这些挑战,基于图像处理的自动化技术曾被广泛应用,例如通过灰度转换、高斯/中值滤波降噪、对比度增强等预处理步骤,再结合Canny、Sobel等边缘检测算法以及阈值化、形态学操作(如膨胀、腐蚀)来识别裂缝。然而,这些经典方法在面对阴影、光照变化、复杂背景噪声等现实条件时鲁棒性不足,且通常需要手动调整参数,难以自动适应不同的数据集。相比之下,深度学习模型能够从标注数据中自动学习特征,提供了更高的自动化程度和准确性,因而成为近年来的研究热点。此观点的论据来源于对技术发展脉络的梳理,引用了多篇早期关于图像处理和深度学习在裂缝检测中应用的奠基性文献,清晰地勾勒出从“人工”到“自动”,从“基于规则”到“基于学习”的技术演进路径。

第二个核心观点是:一系列公开的、多样化的数据集是推动深度学习裂缝检测模型发展的基石,不同数据集专注于不同的结构类型和现实挑战。 论文用了专门章节详细介绍了该领域常用的关键数据集,并制成表格进行对比。这些数据集覆盖了各种结构表面,以应对不同的实际条件。例如,Crack500、CFD和DeepCrack数据集主要针对路面(沥青和混凝土),图像中包含车道线、阴影等噪声。CrackSC和Khanhha数据集则进一步包含了苔藓、树叶和变化光照等更恶劣条件下的道路裂缝。Facade390和PEER Hub ImageNet数据集专注于建筑立面的墙体裂缝。Concrete Crack Dataset和Mcrack1300提供了关于楼板、砖墙等构件的裂缝数据,用于研究建筑缺陷。CrackTree260则专注于铺砌路面上复杂的裂纹图案。EDMCrack600数据集还包含了对比度增强处理,以研究裂缝可见性。作者通过列举这些数据集的具体名称、结构类型、图像数量及尺寸,有力地证明了当前研究具有丰富的、贴近现实的数据基础,这为训练和评估各种复杂的深度学习模型提供了可能,也是比较不同方法性能的前提。

第三个核心观点是:卷积神经网络及其变体,特别是U-Net架构,是当前裂缝分割任务中应用最广泛且表现稳健的技术路线。 文章将深度学习裂缝检测任务分为分类、目标检测和分割三类,并重点聚焦于分割任务。在“基于CNN的分割”和“基于U-Net的分割”两小节中,作者详细综述了多种模型及其改进。例如,Rony Kalfarisi等人比较了Faster R-CNN结合随机森林与Mask R-CNN两种方案,后者实现了检测与分割的一体化,在真实条件下对桥梁、道路等多种结构取得了更高的精度。Donghan Lee等人提出的CSN网络采用端到端的全图像分割,避免了基于图像块的局限性,在真实和合成数据集上均取得了超过97%的准确率。Rundong Pu等人的工作引入了空洞卷积和空洞空间金字塔池化来扩大感受野、捕获多尺度特征,并使用深度可分离卷积降低计算成本,实现了高精度和快速推理。在U-Net系列中,研究则更多地集中在改进编码器、引入注意力机制和多尺度特征融合上。例如,Fangyu Liu等人对比了以VGG19、InceptionResNetV2和EfficientNetB3为编码器的U-Net变体,其中U-Net-VGG19取得了最佳综合评分。Xinnan Fan提出的AN-UNet采用了嵌套结构和注意力机制以更好地融合特征并聚焦裂缝区域。Gui Yu提出的RUC-Net以ResNet18为编码器,并加入了空间-通道挤压激励注意力模块,同时使用Focal Loss解决类别不平衡问题。Xinwen Gao和Bairui Tong的MRA-UNet结合了多尺度残差模块和双重注意力模块,并采用自动颜色均衡进行图像增强。Chengjia Han等人的CrackW-Net则设计了新的跳跃级往返采样块来增强特征融合。这些综述表明,基于CNN/U-Net的方法通过不断的架构创新,在精度、鲁棒性和效率之间寻求平衡,构成了当前技术应用的主流。

第四个核心观点是:新兴的视觉基础模型和生成式模型,如SAM和扩散模型,为裂缝分割带来了新的范式,在精度和泛化能力上展现出巨大潜力,但也面临计算负担的挑战。 论文专门设置了“基于SAM的分割”和“基于扩散模型的分割”两个小节,介绍了前沿探索。K. Ge等人提出的CrackSAM模型,利用了Meta发布的Segment Anything Model,通过参数高效微调技术(如适配器方法和低秩自适应LoRA)对其进行微调,使其适应裂缝分割任务,在多个数据集上取得了优异的交并比,并展现了强大的零样本泛化能力。Zehao Ye等人提出了两种基于SAM的改进方案:LoRA-SAM结合Mask2Former解码器,以及LoRA-SAM结合自生成提示器,在提升分割精度的同时,还能进行精确的裂缝尺寸估计。Wei Zhou等人开发了一个SAM系统框架,加入了裂缝适应层和稀疏提示生成方法,在保持较快推理速度的同时,对噪声和亮度变化表现出鲁棒性。另一方面,生成式扩散模型也被用于裂缝分割。Chengjia Han等人提出的CrackDiffusion采用两阶段方法,第一阶段使用扩散模型去除裂缝特征生成“无裂缝”图像,通过比较原图与生成图来定位裂缝;第二阶段使用增强的U-Net进行精细分割,在多个基准数据集上取得了领先的IOU分数。Saúl Cano-Ortiz等人的RoadPainter模型利用去噪扩散概率模型生成逼真的合成裂缝图像,用于数据增强,显著提升了后续分割模型的性能。作者在表格中对比了这些先进模型的评估指标(如精确度、召回率、F1分数、IOU),数据表明它们在特定条件下能达到甚至超越传统CNN方法的表现。然而,文章也客观指出,这类模型通常需要巨大的GPU资源和更长的训练/推理时间,这是其走向实时部署的主要障碍。

第五个核心观点是:尽管深度学习取得了显著进展,但该领域仍面临若干共同的挑战与局限,制约着其在真实世界中的大规模应用。 论文在“常见挑战与局限”章节对此进行了集中阐述,主要归纳为四点:一是计算复杂性与资源消耗,特别是扩散模型和Transformer-based模型(如SAM)对GPU要求高,训练耗时,不适合实时或资源受限场景;二是推理与采样速度慢,扩散模型的迭代采样特性使其难以实时应用,复杂架构的推理延迟也影响可扩展性;三是对背景与图像质量敏感,模型在低对比度、光照变化、阴影和噪声等真实条件下性能易下降,导致误检或漏检;四是对细小裂缝检测能力有限,尤其是U-Net类模型在低分辨率或噪声图像中容易丢失微弱、纤细或不连续的裂缝特征。这些论据并非空泛之谈,而是贯穿于前文对各模型优缺点(在对比表格中明确列出)的分析之中,例如多次提到某模型“计算复杂”、“资源密集”、“在阴影或模糊裂缝上性能下降”、“对细小裂缝检测不足”等,从而使挑战的总结有据可依,指出了未来技术发展的攻坚方向。

第六个核心观点是:未来的研究应聚焦于模型轻量化、实时化、小目标检测能力提升以及领域知识融合,以推动深度学习裂缝检测技术从实验室走向工程实践。 在结论部分,作者基于全文的综述分析,展望了未来研究方向。总结指出,深度学习模型为裂缝检测提供了自动化、精确且可扩展的解决方案,CNN-based模型、SAM和扩散模型等均在特定方面展现出优势。然而,要真正实现高效可靠的基础设施维护,必须着力解决当前存在的瓶颈。因此,未来工作应致力于:优化并部署轻量级模型以满足实时操作需求;改进模型架构和训练策略以增强对细小裂缝的检测能力;将土木工程领域的先验知识(如裂缝形态学、材料特性)嵌入到模型设计中,提升其在动态复杂环境下的鲁棒性。这一观点是对全文技术脉络和现存问题的自然升华,为读者指明了该领域价值最大化的潜在路径。

这篇综述论文的价值和意义在于: 它对基于深度学习的裂缝检测与分割领域进行了一次及时而全面的梳理,结构系统,内容详实。不仅归纳了从传统图像处理到现代深度学习,再到前沿基础模型的技术发展历程,还详细列举并对比了关键数据集、主流模型架构及其性能指标。更重要的是,论文没有停留在技术罗列层面,而是通过对比分析和表格归纳,清晰揭示了各类方法的优势、劣势及适用场景,并客观、深刻地总结了领域内普遍面临的核心挑战。这为刚进入该领域的研究者提供了一份宝贵的地图,也为资深研究者进行技术选型、寻找创新点提供了参考。同时,论文将最终落脚点放在“实际基础设施监测”的应用愿景上,强调从“模型性能”到“工程可用性”的跨越所必须解决的问题,体现了综述的实践导向和前瞻性,对促进计算机视觉与土木工程健康的跨学科融合与实际应用具有重要的指导意义。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com