基于卷积神经网络的电力线走廊激光雷达点云分割研究
作者及发表信息
本研究的作者为 Jisheng Yang, Zijun Huang, Maochun Huang, Xianxian Zeng, Dong Li, Yun Zhang,均来自 Guangdong University of Technology, Guangdong, China。论文标题为 “Power Line Corridor LiDAR Point Cloud Segmentation Using Convolutional Neural Network”,发表在 PRCV 2019(Springer Nature Switzerland AG 2019,LNCS 11857,pp. 160–171)。
研究背景
电力线是国家重要基础设施,其安全运行需定期巡检,以防止机械损伤或植被侵扰导致的故障。传统巡检方法依赖手工特征提取(handcrafted features),需针对特定电力线走廊的先验知识,泛化能力较差。近年来,深度学习在三维点云分割(3D point cloud segmentation)领域取得进展(如PointNet),但尚未应用于电力线走廊场景。
本研究旨在提出首个端到端(end-to-end)的深度学习框架,实现电力线走廊激光雷达(LiDAR)点云的自动分割,解决以下挑战:
1. 地形复杂性:电力线走廊包含陡坡、平地交错环境,传统方法难以适应;
2. 点云属性变异:激光强度(intensity)分布受飞行高度、大气条件影响显著;
3. 泛化需求:需适用于未知走廊环境,避免手工特征依赖。
研究方法与流程
1. 数据集构建
- 电力线走廊数据集:
- 数据来源:机载激光扫描仪(airborne laser scanner)采集,覆盖面积72万平方米,包含16个点云文件,标注9类对象(如高压铁塔、导线、树木等)。
- 重组为3类:铁塔(pylon)、导线(power line)、其他(others,含树木和地面),以简化任务并贴近实际应用。
- KITTI数据集:
- 补充验证泛化能力,从原始Velodyne点云中标注7481帧数据,用于自动驾驶场景对比。
2. 点云预处理
- 分块与采样:将点云切割为10×10平方米的区块,每块随机采样4096个点(密度40.96点/平方米),确保输入尺寸统一。
- 通道设计:提出四种点云特征表示(P0–P3),优化局部与全局特征:
- P0(基准):直接采用PointNet的原始特征(坐标x,y,z、强度in、归一化坐标xn,yn,zn)。
- P1:引入局部高度(zl = z - zmin_block),替代全局高度z。
- P2:改进强度归一化(in2 = i/imax_file),替代固定值归一化(in = i/255.0)。
- P3:新增局部强度特征(in1 = i/imax_block),形成局部-全局双通道强度表示。
3. 网络架构
基于PointNet改进,流程如下:
1. 输入:B×N×C×1张量(B为批次大小,N为点数量,C为通道数)。
2. 特征提取:5层点卷积(point-wise convolution)独立处理每个点。
3. 全局特征聚合:最大池化(max pooling)解决点云无序性问题。
4. 特征融合:跳跃连接(skip connection)整合局部(conv5层)与全局特征(fc2层)。
5. 输出:逐点分类预测,类别数P=3(铁塔、导线、其他)。
4. 实验设计
- 评估指标:交并比(IoU)、精确率(precision)、召回率(recall)。
- 对比方法:PointNet(P0)与SqueezeSeg(KITTI对比)。
- 训练设置:15个文件训练,1个文件验证;GTX 1070 GPU,无加权损失(weighted-loss)。
主要结果
电力线走廊数据集
- 通道设计验证:
- P0:无法识别铁塔(IoU=0),因依赖全局高度导致坡顶误分类。
- P1:引入局部高度后,铁塔IoU提升至47.61%。
- P2:动态强度归一化使铁塔IoU进一步提高至73.56%(较P1提升54.5%)。
- P3:局部-全局强度特征组合达到最佳性能(铁塔IoU=77.57%)。
- 类别不平衡问题:铁塔点数仅占0.14%,导致召回率(89%)低于导线(98.69%)和树木(99.99%)。
KITTI数据集
- 泛化能力:
- 在车辆(car)分类上,本方法IoU(64.1%)优于PointNet(60.7%)和SqueezeSeg无CRF版本(60.9%)。
- 证明所提通道设计适用于平坦场景(如道路),但电力线走廊的复杂地形需局部高度特征支持。
研究结论与价值
- 科学价值:
- 提出首个电力线走廊点云分割的深度学习框架,摆脱手工特征依赖。
- 设计有效的局部-全局特征组合(P3),显著提升铁塔与导线分割精度。
- 应用价值:
- 单阶段分割(0.93 ms/m²)适合实时巡检,避免多阶段方法的误差累积。
- 仅需LiDAR数据,对光照、分辨率不敏感,稳定性优于图像方法。
- 泛化性:在电力线与自动驾驶场景均表现优异,验证方法普适性。
研究亮点
- 创新性:首次将端到端深度学习应用于电力线走廊分割,提出针对性的通道表示。
- 方法优势:局部高度与动态强度归一化设计解决地形与强度变异问题。
- 工程意义:公开大规模标注数据集,推动领域研究;算法效率满足实际部署需求。
其他价值
- 数据集贡献:标注的电力线走廊数据集填补领域空白,涵盖多样地貌与设备类型。
- 跨场景验证:在KITTI的表现证明方法可扩展至其他三维分割任务(如自动驾驶)。