邹俊志 Et Al - 2021 - 复杂背景下基于改进YOLO v3算法的桥梁表观病害识别

第 18 卷第 12 期铁道科学与工程学报 Volume 18 Number 12
2021 年 12 月 Journal of Railway Science and Engineering December 2021

DOI: 10.19713/j.cnki.43-1423/u.T20201228
复杂背景下基于改进 YOLO v3
算法的桥梁表观病害识别
邹俊志 1，杨建喜 2，李昊 2，帅聪 2，黄蝶 2，蒋仕新 2
(1. 重庆交通大学土木工程学院，重庆 400074；

2. 重庆交通大学信息科学与工程学院，重庆 400074)
摘要：为提升复杂背景下混凝土桥梁表观病害检测精度，提出一种基于改进 YOLO v3 算法的桥梁表观病害检测方法。首

先，针对病害存在密集分布且病害尺度变化较大的特点改进了 YOLO v3 的网络结构，在检测层中嵌入 SE 注意力机制模块
和空间金字塔池化模块，加强了语义特征提取能力；其次，选用定位能力更好的 CIoU 作为损失函数进行训练；最后，通过
K-means 算法对桥梁表观病害缺陷数据集进行锚框聚类。为验证本文所提出算法的有效性，建立 1 363 张包含桥梁露筋、剥
落、水侵蚀病害的数据集，经手工标注、数据增强后进行网络训练。实验结果表明：改进后的 YOLO v3 模型相比原有模型
在精确率、召回率、平均分类精度等指标上均有较大提升，其总体平均精度均值提高了 5.5%。在 RTX2080 Ti 显卡下检测帧
率达到 84 fps，能够更加精准并实时地检测桥梁病害。
关键词：YOLO v3 算法；桥梁病害检测；SENet；空间金字塔池化
中图分类号：U446 文献标志码：A 开放科学(资源服务)标识码(OSID)
文章编号：1672-7029 （2021） 12-3257-10
Bridge apparent damage detection based on the improved YOLO v3 in

complex background
ZOU Junzhi1, YANG Jianxi2, LI Hao2, SHUAI Cong2, HUANG Die2, JIANG Shixin2
(1. School of Civil Engineering, Chongqing Jiaotong University, Chongqing 400074, China;
2. School of Information Science and Engineering, Chongqing Jiaotong University, Chongqing 400074, China)
Abstract: To improve the detection accuracy of concrete bridge apparent disease under complex background, a
bridge apparent distress detection method was proposed based on an improved YOLO v3 algorithm. According to
the characteristics of dense distribution, and multiscale of bridge apparent disease, the YOLO v3 network
structure was remolded as follows. First, the squeeze and excitation networks attention mechanism module and
the spatial feature pyramid pooling module were embedded in the detection layer to strengthen the semantic
feature extraction ability. Second, the CIoUloss function with better positioning ability was selected to train the
network. Finally, the K-means algorithm was used to cluster the bridge apparent disease defect datasets. To verify
收稿日期：2020-12-24
基金项目：国家自然科学基金青年基金资助项目(62003063)；重庆市教委科学技术研究计划项目(KJZD-M202000702，KJQN202000726)；重庆市
自然科学基金资助项目(cstc2020jcyj-msxmX0047)；重庆交通大学研究生科研创新项目(2020S0045)
通信作者：蒋仕新(1992−)，男，重庆人，讲师，博士，从事计算机视觉研究；E−mail：shixinjiang@cqjtu.edu.cn
3258 铁道科学与工程学报 2021 年 12 月
the effectiveness of the proposed algorithm, 1363 datasets including bridge exposed rebar, spalling, and corrosion
diseases were established, which were manually annotated and augmented for network training. Experimental
results show that the improved YOLO v3 model has greatly improved the precision rate, recall rate, Average
Precision, and other indicators compared with the original model, and its mean Average Precision has increased
by 5.5%. The detection frame can achieve 84 FPS under RTX 2080 Ti GPU, which can be more accurate and real-
time detection for bridge disease.
Key words: YOLO v3 algorithm; bridge disease detection; SENet; spatial pyramid pooling
截止 2019 年底，我国公路桥梁数量已达 87.83 景下的多种桥梁结构病害。沙爱民等[8] 设计了 3 种

万座、6 063.46 万 m。伴随大量桥梁建成服役，桥 CNN 神经网络分别应用于路表病害识别、裂缝特
梁管养任务日趋艰巨。受混凝土材料老化、车辆征提取、坑槽特征提取，证明了 CNN 精度足以满
超载严重、运营环境恶劣等多重因素耦合作用，足裂缝、坑槽等病害的复杂形态特性。韩晓健等[9]
在役桥梁会不可避免地产生开裂、保护层剥落、将 CNN 应用于桥梁结构表面病害检测，通过迁移
渗水泛碱、露筋锈蚀等病害[1]，对桥梁结构的安全学习训练并微调了 AlexNet 模型，构建了裂缝、锈
性和耐久性是极大考验。传统的桥梁检测方法以蚀、缺损 3 类病害识别模型。然而这类基于 CNN
人工巡检为主，存在主观性强、工作量大、效率的图像分类方法很难去定义滑动窗口的大小，也
低等缺点，逐渐不能满足人们的需求。随着传感难以处理具有不同大小的病害图像。为进一步提
器采集、信息存储与分析技术的发展，基于数字高检测和定位多种桥梁病害的效率，基于 CNN 的
图像处理的桥梁病害检测技术引起了学界的广泛
各种目标检测算法正获得持续关注。CHA 等[10] 使
关注。刘建威等提出一种基于双目视觉的桥面裂
[2]
用 Faster R-CNN 算法，对混凝土裂缝和不同程度
缝检测方法，对裂缝图像进行高斯滤波、直方图
的螺栓、钢板腐蚀等 5 种损伤类型进行识别和定
均衡化、边缘检测、二值化操作，最后经双目视
位。 XU 等[11] 提出了一种改进的 Faster R-CNN 方
觉系统计算出裂缝尺寸。陈飞飞等提出了基于图 [3]
法，用于检测钢筋混凝土柱地震后不同损伤类型。
像特征值的混凝土桥梁表面病害分类方法，通过
相比以 Faster R-CNN[12]为代表的两阶段目标检测算
提取病害图像的灰度直方图特征、颜色矩特征及
法，以 SSD[13] 和 YOLO[14] 为代表的单阶段目标检测
纹理特征，运用支持向量机 (Support Vector Ma‐
算法，避免了生成候选区域这一步骤，实现了更
chine，SVM)实现了病害图像的分类。韩琨等[4] 基
快的检测速度，更适用于桥梁自动化巡检场景中。
于图像连通域特征，采用 SVM 进行特征分类检测
ZHANG 等[15]基于 YOLO v3 算法实现了桥梁表面裂
裂缝区域。但这类方法主要依靠人工经验进行样
缝、露筋、剥落等多种缺陷的实时检测。然而现
本特征抽取，且构建的仍是没有层次的单层特征，
有的基于深度学习的目标检测算法中，尚未根据
在桥梁自动化巡检中应用场景有限。伴随着无人
桥梁表面病害特点进行改进，针对复杂背景下桥
机[5]、爬壁机器人[6] 等智能检测设备在桥梁结构外
观评估方向的迅速发展，为进一步分析智能检测梁病害的目标检测算法仍亟需构建。在现有研究
设备采集的大量病害图像，以卷积神经网络[7](Con‐ 基础上，本文对 YOLO v3 算法进行改进，以解决
volutional Neural Network，CNN)为代表的基于深桥梁病害存在的密集分布、尺度变化较大等问题，

度学习的方法，正逐渐成为学术界与工业界的研提升检测桥梁病害的精度。其次，本文就复杂背
究热点。相较于传统的机器学习算法，CNN 能够景下的桥梁表观病害检测任务制作了相应的数据
自动提取病害结构特征，避免了传统算法所需的集，将桥梁检测图像划分为露筋、剥落和水侵蚀 3
人工经验。且 CNN 具有很强的滤去背景噪声能种病害类别，并对数据进行了人工标注用于训练
力，能够克服桥梁结构表面存在的污渍、遮挡、
[8]
模型网络。最后，通过测试集验证了本文所提出
光照不均等多种产生噪声干扰，足以识别复杂背模型的可行性和准确性。
第 12 期邹俊志，等：复杂背景下基于改进 YOLO v3 算法的桥梁表观病害识别 3259
合，增强了对不同大小病害的检测效果,使得所有
尺度下的病害特征细节更为丰富，其预测方式如
1 YOLO v3 算法
图 1 所示。
在检测层中，YOLO v3 将输入的病害图像按
YOLO v3 算法是由 REDMON 等[14] 提出的一种
照特征图尺寸大小划分成 S×S 个网格，每个单元格
基于回归的单阶段目标检测算法，由特征提取主
负责检测落入其中心的病害，同时输出多个预测
干网络和检测层 2 个部分组成。受 ResNet[12]残差网
框和每个预测框的置信度。每个边界框(bounding
络启发，YOLO v3 在主干网络中加入了残差单元， box)包含参数 (t c ,t x ,t y ,t w ,t h )，其中 c 为置信度变量，
组成了特征提取主干网络 darknet53，使得网络模采用 sigmod 函数， (t x ,t y ) 为候选框的中心坐标，
型准确率增加的同时有效缓解了深度神经网络中 (t w ,t h ) 为候选框的中心点。在位置预测上，以每张
的梯度消失问题。YOLO v3 在最后 3 次下采样中以特征图上某单元左上角坐标为 ( c x ,c y ) 为例，每个锚
1/32，1/16 和 1/8 的下采样率分别输出 13×13，26× 框(anchor)预测尺寸为 ( p w ,p h )，所生成的预测坐标
26，52×52 这 3 种不同尺度的特征图。同时借鉴了为 ( bx ,by ,bw ,bh )，其中 ( bx ,by ) 为预测边界框的中心坐
特征金字塔[16] (FPN，feature pyramid networks)的多标，( bw ,bh ) 为预测框的宽度和高度，具体如图 2 所
尺度预测方式，将提供图像深层语义信息的小尺示。输出多个预测框后，将抛弃置信度低的预测
寸特征图与提供较大感受野的大尺寸特征图相融框并通过非极大值抑制最终定位病害位置。
图1 多尺度预测方式
Fig. 1 Multi-scale forecasting
图2 带有锚框和预测位置的边界框
Fig. 2 Bounding box with anchor and predicted position
YOLO v3 算法虽然检测速度快且精度较高，征图。SENet 是由 LIN 等[16] 提出的一种注意力机制

但直接应用在复杂背景下的桥梁表观病害检测中结构，其网络结构如图 3 所示[17]。SE 模块主要包括
仍存在以下几点不足。其一，桥梁表面病害存在压缩(squeeze)和激励(excitation)2 种操作。首先输
密集分布且病害尺度变化较大等问题，其特征提入特征图 X ∈ RH ′ × W ′ × C′，经过 F tr 变换后得到特征
取能力仍有待进一步加强；其二，YOLO v3 采用图 U ∈ RH × W × C，其中 U = [ u 1 ,u 2 ,…,u c ]。随后对特
了多尺度预测方式，虽然充分利用了感受野及语征图 U 进行全局平均池化计算，得到大小为 1 ×
义特征，但其提取的特征鲁棒性较差，无法应用 1 × C(C 为通道数)的特征图 Z c。
H × W i = 1∑
∑
Z c = F sq ( u c ) =
H W
于复杂背景下的桥梁病害检测；其三，交并比 IoU 1
u c (i,j ) (1)
虽然可以反映预测框与病害真实标注框间的检测 j=1
为进一步提取通道间相关性，将生成的特征
效果，但当 2 框并未相交的时候，IoU 无法提供任
图分别经过 2 个全连接层，对特征图先降维后升
何调整梯度，对于病害位置的预测精度也会有所
维，压缩率 r 设置为 16，再使用 sigmod 激活函数，
下降。故而针对上述问题，本文结合桥梁病害特
得到各通道间对应的权重 S = [ s 1 ,s 2 ,…,s c ]。
性对 YOLO v3 算法进行改进。
(
S = F ex ( Z c ,W ) = sigmod W 2 ReLU ( W 1 Z c ) ) (2)
2 改进的 YOLO v3 算法 C C
W1 ∈ R r ,W 2 ∈ R
×C C×
r
(3)
算法的具体改进主要可分为 4 个部分，分别为最后将各个通道与对应权重相乘进行权值更
嵌入 SENet 的特征提取网络、空间金字塔池化模新，得到更新后的输出 X = [ x 1 ,x 2 ,…,x c ]。
块、采用更好地定位损失函数以及聚类自己数据 x c = F scale ( u c ,s c ) = s c ⋅ u c (4)
集的 anchor，从而提升算法整体的检测精度。 SE 注意力机制使网络在生成特征图的过程中
2.1 嵌入 SENet 的特征提取网络更加“关注”不同类型的桥梁病害特征，同时通
为解决桥梁病害检测中存在的病害重叠、密过网络自注意力的形式，增强了病害特征的语义
集分布等问题，本文分别在 YOLO v3 的 3 个检测信息，有效抑制了混凝土桥面复杂的背景信息，
层前嵌入 SE 注意力机制结构，使网络生成通道权解决了桥梁表观病害密集分布时识别精度较差的
重并对通道进行重标定，输出表达能力更强的特问题。
图3 SE 网络结构
Fig. 3 Squeeze and excitation networks structure
2.2 空间金字塔池化模块池化层，进一步将病害的局部特征信息与全局特

为解决桥梁病害在不同的桥检人员拍摄图像征信息融合获得更丰富的结构特征表示，尤其针
中尺度变化较大，难以较好地提取病害特征问题。对不同大小病害的检测任务，提升病害总体识别
本文引入空间金字塔池化(Spatial Pyramid Pooling, 精度。SPP 模块的结构图如图 4 所示。
SPP) 模块进一步丰富特征图信息。 SPP 是由 HE 2.3 定位损失函数
等提出的一种解决神经网络不同图像尺寸输入问
[17]
IoU 作为目标检测中最常用性能指标之一，表
题的方法。从主干网络 darknet53 输出的特征图分示真实标注病害框与预测病害框的交并比，其计
别经过卷积核大小为 5×5，9×9，13×13 的 3 个最大算如式(5)所示：
|B pred ∩ B true | 定位预测。然而在自建的桥梁数据集上，病害间

IoU = (5)
|B pred ∪ B true | 尺度变化较大，且长宽比存在显著不同，故而需
要聚类自己的 anchor boxes，经 K-means 聚类后总
其中： B pred 表示桥梁病害预测框； B true 表示桥梁病
共生成了 9 组先验框，分别为 (11×34)， (33×15)，
害真实标注框，IoU 的大小反映了病害的检测效
(16×72)，(41×52)，(88×25)，(25×163)，(67×175)，
果。但当病害预测框与真实框并未相交时，IoU 为
(120×70)，(190×161)。
0，无法反映此时两者间的距离大小，导致无法传
播调整梯度。为解决此问题，本文引入了最新提
出的 CIoU[18] 定位函数，相较于 IoU，CIoU 考虑了
病害预测框与真实框间的中心点距离，重叠比以
及长宽比，使得在梯度下降时，边界框回归更加
稳定。CIoU 的计算如式（6）所示：
ρ2 ( b,bgt )
CIoU = IoU - - αβ (6)
c2
式中：b 和 bgt 分别代表病害预测框和真实框的中心图4 SPP 网络结构图
Fig. 4 Spatial pyramid pooling structure
点； ρ2 ( b,bgt ) 代表病害预测框与中心框间的欧式距
离； c 表示能够同时包含病害预测框与真实框的最融合了上述方法之后组成的改进 YOLO v3 算
小区域的对角线距离； α 为权衡参数； β 则用来衡法其结构图如图 5 所示，其中 SE 注意力层分别嵌
量长宽比的一致性。入 3 个检测层中，其具体位置位于 darknet53 网络
2.4 通过 k-means 算法聚类锚框第 86，99，112 层，SPP 模块具体位于网络第 78~
YOLO v3 通过使用 anchor boxs 对边界框进行 83 层。
图5 改进的 YOLO v3 结构
Fig. 5 Improved YOLO v3 architecture
选出总计 1 363 张桥梁检测照片，共标注了 2 603

3 桥梁病害数据集与超参数设置个目标病害真实值。这些桥梁病害图像由不同的
桥梁巡检人员拍摄，筛选图片的原则是病害区域
3.1 桥梁病害图像数据集清晰且图像分辨率较高。采用开源的 labelimg 工具
针对桥梁检测报告中最为常见的混凝土剥落对每张图像病害区域进行标注，部分标注真实值
(spall)、露筋(rebar)和渗水(corrosion)3 种病害，筛 (ground-truth)示例如图 6 所示。
图6 桥梁表观病害标注示例
Fig. 6 Bridge apparent damage ground truth
3.2 实验环境介绍作为训练集，20% 的图像作为测试集。在训练过

实验采用开源的 Pytorch1.6.0 深度学习框架，程中，对训练集进行数据增强，分别采用随机裁
CPU 配置为 Intel® Core ™ i9-9900KF，显卡为 Ge‐ 剪、平移、水平翻转、垂直翻转等方式，提升模
Force RTX 2080Ti，内存大小为 64GB，系统为型的泛化能力，增强后的训练集共计 5 455 张。为
ubuntu18.04 LTS， Python3.7.7， CUDA 10.2， cu 进一步增强小目标识别效果，本文采用了 mosaic[20]
DNN 7.6.5，OpenCV 4.4.0 环境。数据增强方式。将 4 张图片进行随机裁剪，再拼接
3.3 实验参数设置到一起，极大丰富了待检测物体的背景，提升了
网络训练采用带动量的随机梯度下降算法，
小目标识别的效果。
动量因子为 0.9；初始学习率设置为 0.01，最终学
习率设置为 0.000 5，学习率衰减策略为余弦退火 4 实验结果分析
策略[19]，则学习率 η t 可表示为如式(7)所示，其中 t
为 batch 大小，T 为整个 epoch 轮数。 4.1 性能评价指标
ηt =
1
2(1 + cos( ))
tπ
T
η (7)
本文选择目标检测中常用的评价指标来进行
分析，采用的统计指标为精确率(precision)、查全
batch size 大小设置为 16，训练轮数为 300 轮。率(recall)、每类病害的精度均值 AP(Average Preci‐
模型输入图像尺寸为 416×416，将其中 80% 的图像 sion)、病害的平均精度均值 mAP(mean Average
Precision，mAP)及检测速度 FPS 进行评价。检测如表 1 所示，其中混凝土剥落和露筋病害取得了较

结果可分为 4 种：真正例 TP，真反例 TN，假正例高的检测精度，而渗水病害检测精度相对较低。
FP，假反例 FN。精确率及查全率如式 (8) ～ (9) 这是因为剥落和露筋与背景差异性相对较大，提
定义：取的特征鲁棒性较好，而水侵蚀病害在梁底分布
TP
Precision = (8) 不均匀且与背景差异性相对较小，故而整体检测
TP + FP
的分类精度相对较低。同时本文所提出的改进 YO‐
TP
Recall = (9)
TP + FN LO v3 算法在桥梁表观病害检测中取得了更佳的性
平均精度 AP 和平均精度均值 mAP 如式(10)～能，在 mAP 值上提升了 5.5 %。
(11)定义：
∫ P ( R ) dR
1 表1 YOLO v3 与改进的 YOLO v3 性能对比
AP = (10) Table 1 Comparison of YOLO v3 and improved YOLO v3
0
∑AP
N
Methods Spall Corrosion Rebar mAP/% FPS
i
i=1
mAP = (11) YOLO v3 0.794 0.634 0.800 0.743 86
N
Our methods 0.860 0.684 0.850 0.798 84
其中：N 表示病害类别的数量。FPS 是指使用 GPU
时每秒能够检测图像数量。本文主要采用 mAP@
接下来，本文将具体展示复杂背景下混凝土
0.5 指标和检测速度 FPS 来评价模型。
剥落、水侵蚀和露筋 3 种病害的实际检测效果，
4.2 实验结果分析
4.2.1 本文算法与 YOLO v3 算法实验结果对比 YOLO v3 与改进 YOLO v3 的检测效果如图 7～8
YOLO v3 与改进后的 YOLO v3 算法性能对比所示。
图7 YOLO v3 算法识别病害结果
Fig. 7 Detect disease results by using YOLO v3 algorithm
从图 7 和图 8 中可以看出，改进后的 YOLO v3 标尺寸相对较小的桥梁露筋病害，也具有更高的

算法具有更高的病害识别精度，既能够识别出目混凝土剥落、水侵蚀病害识别精度，同时在弱光
条件下仍具有更好的病害识别精度，能有效改善能，本文引入了 Precison-Recall (P-R)曲线来评价模

因背景复杂、密集分布、光照条件和病害尺寸较型的性能，P-R 曲线的横坐标为查全率，纵坐标为
小等因素造成的病害错检、漏检情况。为了更好精确率，图 9 展示的是 2 种算法的总体 P-R 曲线对
地权衡 YOLO v3 算法与改进的 YOLO v3 算法的性比图。
图8 改进的 YOLO v3 算法识别病害结果

Fig. 8 Detect disease results by using improved YOLO v3 algorithm
4.2.2 消融实验结果分析
为进一步分析所加入的每种网络结构分支对
于模型整体的影响，将本文所提出的改进 YOLO
v3 算法划分成 5 组不同的网络模型进行消融实验。
实验总共可以分为 5 组，其中第 1 组代表 YOLO v3
算法，第 2 组对训练集数据进行了 mosaic 数据增
强，第 3 组在第 2 组基础上采用了 CIoU 定位损失
函数，第 4 组加入了 SPP 空间金字塔池化模块，最
后一组在第 4 组基础上嵌入了 SE 注意力机制，即
第 5 组为本文所提出的改进的 YOLO v3 算法，具
图9 2 种算法的 P-R 曲线对比
体实验结果如表 2 所示。
Fig. 9 Comparison of P-R curves between two algorithms
从表 2 消融实验的结果可知，第 1 组原有版本
从图 9 可以看出，改进后的 YOLO v3 算法的的 YOLO v3 取得了 74.3% 的 mAP 值，检测速度
P-R 曲线面积完全大于 YOLO v3 的曲线面积，其 FPS 为 86；第 2 组采用了 mosaic 数据增强，丰富了
精确率和查全率均优于 YOLO v3 算法，具备更强检测图像背景，提高了模型的泛化能力，其 mAP
的特征提取能力，更加适用于复杂背景下的桥梁值整体提升了 1.2%；对于第 3 组模型，由于采用
病害检测场景中。了 CIoU 定位损失函数，更好地描述了预测框与真
实病害标注框的距离，进一步加速了模型的收敛测速度也随着网络模块的引入略有下降；最后一
速度，故提升了检测精度和检测速度；而第 4 组实组即本文所提的改进 YOLO v3 算法，通过嵌入了
验嵌入了空间金字塔池化模块，进一步解决了病 SENet 注意力机制，进一步增强了病害特征的语义
害在不同检测图像中尺度变化较大的问题，尤其信息，达到了 79.8% 的 mAP 值，同时也增加了模
是针对水侵蚀病害，其 AP 值提升了 3.3%，同时检型参数量，故最终检测速度为 84 fps。
表2 消融实验结果分析
Table 2 Comparison of experimental results of ablation
Model Mosaic CIoU SPPNet SENet Spall Corrosion Rebar mAP/% FPS
YOLO v3(1) × × × × 0.794 0.634 0.800 0.743 86
YOLO v3(2) √ × × × 0.825 0.616 0.824 0.755 85
YOLO v3(3) √ √ × × 0.858 0.639 0.828 0.775 87
YOLO v3(4) √ √ √ × 0.824 0.672 0.859 0.785 85
YOLO v3(5) √ √ √ √ 0.859 0.684 0.850 0.798 84
综上所述，所提出的每种改进策略均具有一检测速度，其中 YOLO v3 算法在精度及速度上表

定效果，在剥落、水侵蚀和露筋 3 种不同的桥梁结现得更好。而本文所提出的改进 YOLO v3 算法在
构病害上，与原有的 YOLO v3 算法相比，其 AP 值平均检测精度上有较大提升，其 mAP 值整体提升
分别提升了 6.5%， 5.0%， 5.0%， mAP 值提升了了 5.5%，更加适合应用于复杂场景下的桥梁表观
5.5%，整体提升效果显著。而在检测速度上，随病害检测，同时其检测速度 fps 相较于原有 YOLO
着 SPPNet 和 SENet 等模块的加入也带来了更多的 v3 只减少了 2 fps，仍能保持高速且更加精准地识
模型参数，检测速度 FPS 稍有下降，但仍保持在别桥梁病害。
84FPS，能够做到实时且更加精准地检测桥梁
病害。 5 结论
表3 改进的 YOLO v3 与其他目标检测算法对比 1) 提出了基于改进 YOLO v3 的桥梁表观病害

Table 3 Comparison of improved YOLO v3 with other target 识别方法，通过引入 SE 注意力机制和 SPP 模块来
detection algorithms 生成更丰富信息的特征图，有效地抑制了复杂场
Methods Spall Corrosion Rebar mAP/% FPS 景下混凝土桥梁表面的背景信息，同时选用更好
YOLO v3 0.794 0.634 0.800 0.743 86 的定位损失函数和锚框来训练网络，有效改善了
Faster R-CNN 0.770 0.581 0.776 0.709 15 因背景复杂、密集分布、光照条件、病害尺寸较
SSD-512 0.822 0.597 0.648 0.689 55
小等因素造成的桥梁病害漏检情况。
Our methods 0.859 0.684 0.850 0.798 84
2) 改进的 YOLO v3 算法的 mAP 值达到了
79.8%。相比原有的 YOLO v3 算法，其 mAP 值提
4.2.3 本文算法与其他目标检测算法结果对比
升了 5.5%，同时其检测速度保持在 84FPS，能做
为了更全面地评测本文所提出的改进 YOLO
到快速且更加精准地识别复杂背景下的桥梁病害。
v3 算法，本文使用 Faster R-CNN 检测算法和 SSD
检测算法进行对比实验，实验结果具体如表 3 所
参考文献：
示。从表 3 可以看出，两阶段的 Faster R-CNN 方法
取得了 70.9% 的 mAP 值，但其检测速度受限于需
[1] 贺拴海, 赵祥模, 马建, 等 . 公路桥梁检测及评价技术综
要产生目标候选区域而只达到了 15FPS。而单阶段述[J]. 中国公路学报, 2017, 30(11): 63−80.
的 SSD 和 YOLO 算法由于省去了生成候选区域这 HE Shuanhai, ZHAO Xiangmo, MA Jian, et al. A review
一中间步骤，通过直接预测对象而获得了更快的 of inspection and evaluation technology of highway and
bridge[J]. Chinese Journal of Highway, 2017, 30(11): 63 detecting multiple damage types[J]. Computer-Aided
−80. Civil and Infrastructure Engineering, 2018, 33(9): 731
[2] 刘建威, 钟泽湘 . 基于双目视觉的桥面裂缝检测技术研 −747.
究[J]. 铁道科学与工程学报, 2016, 13(1): 164−167. [11] XU Y, WEI S, BAO Y, et al. Automatic seismic damage
LIU Jianwei, ZHONG Zexiang. A study on detection identification of reinforced concrete columns from
technology of bridge deck cracks based on binocular images by a region-based deep convolutional neural
vision[J]. Journal of Railway Science and Engineering, network[J]. Structural Control and Health Monitoring,
2016, 13(1): 164−167. 2019, 26(3): e2313.1−e2313.22.
[3] 陈飞飞, 张宇峰, 韩晓健 . 基于图像特征值的混凝土桥 [12] REN S, HE K, GIRSHICK R, et al. Faster R-CNN:
梁表面病害图像分类[J]. 结构工程师, 2018, 35(1): 59 Towards real-time object detection with region proposal
−63. networks[J]. IEEE Transactions on Pattern Analysis and
CHEN Feifei, ZHANG Yufeng, HAN Xiaojian. Image Machine Intelligence (TPAMI), 2016, 39(6): 1137−1149.
Classification of surface diseases of concrete bridges [13] LIU W, ANGUELOV D, ERHAN D, et al. SSD: Single
based on image feature value[J]. Strutural Engineer, shot multi-box detector[C]// Proceedings of the 2016
2018, 35(1): 59−63. European Conference on Computer Vision (ECCV).
[4] 韩锟, 韩洪飞 . 基于区域级和像素级特征的路面裂缝检 Amsterdam, Cham: Springer, 2016: 21−37.
测方法 [J]. 铁道科学与工程学报 , 2018, 15(5): 1178 − [14] REDMON J, FARHADI A. YOLO v3: An incremental
1186. improvement[EB/OL]. arXiv preprint 2018. https: //arxiv.
HAN Kun, HAN Hongfei. Detection method of pavement org/abs/1804.02767.pdf
crack based on regional and pixel characteristics[J]. [15] ZHANG C, CHIH-CHEN CHANG, JAMSHIDI M.
Journal of Railway Science and Engineering, 2018, Concrete bridge surface damage detection using a single-
15(5): 1178−1186. stage detector[J]. Computer-Aided Civil and
[5] CHEN S Y, LAEFER D F, MANGINA E, et al. UAV Infrastructure Engineering, 2020, 35(4): 389−409.
bridge inspection through evaluated 3D reconstructions [16] LIN Y, DOLLÁR P, GIRSHICK R, et al. Feature pyramid
[J]. Journal of Bridge Engineering, 2019, 24(4): 1−15. networks for object detection[C]// Proceedings of the
[6] PHILLIPS S, NARASIMHAN S. Automating data IEEE Conference on Computer Vision and Pattern
collection for robotic bridge inspections[J]. Journal of Recognition, 2017: 2117−2125.
Bridge Engineering, 2019, 24(8): 1−13. [17] HE K, ZHANG X, REN S, et al. Spatial pyramid pooling
[7] LECUN Y, BENGIO Y, HINTON G. Deep learning[J]. in deep convolutional networks for visual recognition[J].
Nature, 2015, 521(7553): 436−444. IEEE Transactions on Pattern Analysis and Machine
[8] 沙爱民, 童峥, 高杰 . 基于卷积神经网络的路表病害识 Intelligence (TPAMI), 2015, 37(9): 1904−1916.
别与测量[J]. 中国公路学报, 2018, 31(1): 1−10. [18] ZHENG Z, WANG P, LIU W, et al. Distance-IoU Loss:
SHA Aimin, TONG Zheng, GAO Jie. Identification and Faster and better learning for bounding box regression
measurement of road surface disease based on [C]// Proceedings of the 2020 AAAI Conference on
convolutional neural network[J]. Chinese Journal of Artificial Intelligence (AAAI). Hilton Midtown, New
Highway, 2018, 31(1): 1−10. York, Menlo Park, CA: AAAI Press, 2020.
[9] 韩晓健, 赵志成, 沈泽江 . 卷积神经网络在桥梁结构表 [19] HE T, ZHANG Z, ZHANG H, et al. Bag of tricks for
面病害检测中的应用研究[J]. 结构工程师, 2019, 35(2): image classification with convolutional neural networks
106−111. [C]// Proceedings of the IEEE Conference on Computer
HAN Xiaojian, ZHAO Zhicheng, SHEN Zejiang. Vision and Pattern Recognition, 2019: 558−567.
Application of convolutional neural network in detection [20] BOCHKOVSKIY A, WANG C Y, MARK Liao H Y.
of surface diseases of bridge structures[J]. Structural YOLO v4: Optimal speed and accuracy of object
Engineer, 2019, 35(2): 106−111. detection[EB/OL]. arXiv preprint 2020. https://arxiv. org/
[10] CHA Y J, CHOI W, SUH G, et al. Autonomous structural abs/2004.10934.pdf.
visual inspection using region-based deep learning for (编辑阳丽霞)

邹俊志 Et Al - 2021 - 复杂背景下基于改进YOLO v3算法的桥梁表观病害识别

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

邹俊志 Et Al - 2021 - 复杂背景下基于改进YOLO v3算法的桥梁表观病害识别

Uploaded by

Copyright:

Available Formats

第 18 卷第 12 期铁道科学与工程学报 Volume 18 Number 12

2021 年 12 月 Journal of Railway Science and Engineering December 2021

(1. 重庆交通大学土木工程学院，重庆 400074；

摘要：为提升复杂背景下混凝土桥梁表观病害检测精度，提出一种基于改进 YOLO v3 算法的桥梁表观病害检测方法。首

Bridge apparent damage detection based on the improved YOLO v3 in

截止 2019 年底，我国公路桥梁数量已达 87.83 景下的多种桥梁结构病害。沙爱民等[8] 设计了 3 种

设备采集的大量病害图像，以卷积神经网络[7](Con‐ 基础上，本文对 YOLO v3 算法进行改进，以解决

volutional Neural Network，CNN)为代表的基于深桥梁病害存在的密集分布、尺度变化较大等问题，

YOLO v3 算法虽然检测速度快且精度较高，征图。SENet 是由 LIN 等[16] 提出的一种注意力机制

2.2 空间金字塔池化模块池化层，进一步将病害的局部特征信息与全局特

|B pred ∩ B true | 定位预测。然而在自建的桥梁数据集上，病害间

选出总计 1 363 张桥梁检测照片，共标注了 2 603

3.2 实验环境介绍作为训练集，20% 的图像作为测试集。在训练过

Precision，mAP)及检测速度 FPS 进行评价。检测如表 1 所示，其中混凝土剥落和露筋病害取得了较

YOLO v3 与改进后的 YOLO v3 算法性能对比所示。

从图 7 和图 8 中可以看出，改进后的 YOLO v3 标尺寸相对较小的桥梁露筋病害，也具有更高的

条件下仍具有更好的病害识别精度，能有效改善能，本文引入了 Precison-Recall (P-R)曲线来评价模

图8 改进的 YOLO v3 算法识别病害结果

综上所述，所提出的每种改进策略均具有一检测速度，其中 YOLO v3 算法在精度及速度上表

表3 改进的 YOLO v3 与其他目标检测算法对比 1) 提出了基于改进 YOLO v3 的桥梁表观病害

You might also like

邹俊志 Et Al - 2021 - 复杂背景下基于改进YOLO v3算法的桥梁表观病害识别

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

邹俊志 Et Al - 2021 - 复杂背景下基于改进YOLO v3算法的桥梁表观病害识别

Uploaded by

Copyright:

Available Formats

第 18 卷 第 12 期 铁道科学与工程学报 Volume 18 Number 12

2021 年 12 月 Journal of Railway Science and Engineering December 2021

(1. 重庆交通大学 土木工程学院，重庆 400074；

摘 要：为提升复杂背景下混凝土桥梁表观病害检测精度，提出一种基于改进 YOLO v3 算法的桥梁表观病害检测方法。首

Bridge apparent damage detection based on the improved YOLO v3 in

截止 2019 年底，我国公路桥梁数量已达 87.83 景下的多种桥梁结构病害。沙爱民等[8] 设计了 3 种

设备采集的大量病害图像，以卷积神经网络[7](Con‐ 基础上，本文对 YOLO v3 算法进行改进，以解决

volutional Neural Network，CNN)为代表的基于深 桥梁病害存在的密集分布、尺度变化较大等问题，

YOLO v3 算 法 虽 然 检 测 速 度 快 且 精 度 较 高 ， 征图。SENet 是由 LIN 等[16] 提出的一种注意力机制

2.2 空间金字塔池化模块 池化层，进一步将病害的局部特征信息与全局特

|B pred ∩ B true | 定位预测。然而在自建的桥梁数据集上，病害间

选出总计 1 363 张桥梁检测照片，共标注了 2 603

3.2 实验环境介绍 作为训练集，20% 的图像作为测试集。在训练过

Precision，mAP)及检测速度 FPS 进行评价。检测 如表 1 所示，其中混凝土剥落和露筋病害取得了较

YOLO v3 与改进后的 YOLO v3 算法性能对比 所示。

从图 7 和图 8 中可以看出，改进后的 YOLO v3 标尺寸相对较小的桥梁露筋病害，也具有更高的

条件下仍具有更好的病害识别精度，能有效改善 能，本文引入了 Precison-Recall (P-R)曲线来评价模

图8 改进的 YOLO v3 算法识别病害结果

综上所述，所提出的每种改进策略均具有一 检测速度，其中 YOLO v3 算法在精度及速度上表

表3 改进的 YOLO v3 与其他目标检测算法对比 1) 提出了基于改进 YOLO v3 的桥梁表观病害

You might also like

第 18 卷第 12 期铁道科学与工程学报 Volume 18 Number 12

(1. 重庆交通大学土木工程学院，重庆 400074；

摘要：为提升复杂背景下混凝土桥梁表观病害检测精度，提出一种基于改进 YOLO v3 算法的桥梁表观病害检测方法。首

volutional Neural Network，CNN)为代表的基于深桥梁病害存在的密集分布、尺度变化较大等问题，

YOLO v3 算法虽然检测速度快且精度较高，征图。SENet 是由 LIN 等[16] 提出的一种注意力机制

2.2 空间金字塔池化模块池化层，进一步将病害的局部特征信息与全局特

3.2 实验环境介绍作为训练集，20% 的图像作为测试集。在训练过

Precision，mAP)及检测速度 FPS 进行评价。检测如表 1 所示，其中混凝土剥落和露筋病害取得了较

YOLO v3 与改进后的 YOLO v3 算法性能对比所示。

条件下仍具有更好的病害识别精度，能有效改善能，本文引入了 Precison-Recall (P-R)曲线来评价模

综上所述，所提出的每种改进策略均具有一检测速度，其中 YOLO v3 算法在精度及速度上表