You are on page 1of 9

第 43 卷 第 6 期 中国农机化学报 Vo

l.43 No. 6
20
126年 6月
62 J
our
nalo
fC中国农机化学报
hi
nes
eAg
ricu
ltu
ralMe
chan
iza
tion Jun2.
022
2 年
022

DOI:10.
13733/
jj.
cam.

ssn.
2095 5553.
2022.
06.
022

基于生成对抗网络和混合注意力机制残差
网络的苹果病害识别 *
于雪莹 , 高继勇 , 王首程 , 李庆盛 , 王志强
(山东理工大学计算机科学与技术学院,山东淄博,
255049)

摘要:准确识别并防治病害对提高苹果产量和质量具有重要意义。针对苹果病害图像因病斑区域小且易受背景 干 扰 而 导
致识别准确 率 低 的 问 题,设 计 一 种 基 于 混 合 注 意 力 机 制 的 残 差 网 络 (
Convo
lut
iona
lBl
ock At
ten
tion Modu
le-Re
sidua

Ne
two
rk,CBAM-Re t)模型。该模型在残差网络中嵌入串联的通道注意力模块和空间注意力模块,使 模 型 将 注 意 力
sNe
集中于图像特 征 的 病 害 区 域,提 高 识 别 准 确 率。 针 对 模 型 训 练 数 据 集 样 本 数 量 不 足 且 数 据 不 均 衡 问 题,提 出 基 于
Wa
sse
rst
ein 距离的生成对抗网络(Wa
sse
rst
ein Gene
rat
iveAdve
rsa
ria
lNe
two
rks,WGAN)对数据集进行扩充 的 方 法。 通
过生成器与判别器的对抗训练生成 10000 张苹果 病 害 图 像,对 CBAM-Re t进 行 训 练 和 测 试,提 高 模 型 的 泛 化 能 力
sNe
和鲁棒性。试验结果表明:与 CNN、
VGG-16、
Re t-50、
sNe Inc
ept
ion-V3 等传统模型相比,
CBAM-Re t对苹果病害
sNe
的识别效果更优,其识别准确率、精确率、召回率和 F1-Sc
or 50% 、
e参数分别达到 95. 40% 、
95. 95。该方法能
40% 和 0.
95.
够为苹果病害图像准确识别和实时监测提供技术支撑。
关键词:苹果病害;图像识别;生成对抗网络;残差网络;混合注意力机制
中图分类号:
S432.
9+7 文献标识码:
A 2095 5553 (
文章编号: 2022)06 0166 09

于雪莹,高继勇,王首程,李庆盛,王志强 .基于生成对抗网络 和 混 合 注 意 力 机 制 残 差 网 络 的 苹 果 病 害 识 别 [ J].中 国 农


机化学报,2022,43( ):
6 166-174
Yu Xuey
ing, Gao J
iyong, Wang Shoucheng, L ngsheng, Wang Zh
i Qi iqi
ang.App
led
ise
aser
ecogn
iti
on bas
ed on
Wasse
rste
ingenerat
iveadve
rsar
ialne
tworksand hyb
rida
tten
tion me
chan
ism r
esi
dua
lne
two
rk[
J].J
our
nalo
f Ch
ine
se
Ag
ricul
turalMechani
zat
i , , ( ):
on 2022 43 6 166-174

块中引入捷径 连 接 (
sho
rt t)能 有 效 防 止 特 征 提 取 过
cu
0 引言
程中信息的丢 失,解 决 深 层 网 络 的 退 化 问 题。 但 由 于

1]
苹果是我国栽培面积最广、消费量 最大的水 果 , 植物病斑多存在 于 叶 片 局 部 范 围,模 型 在 训 练 时 会 受
其生长过程中 常 受 到 多 种 病 害 的 侵 袭,准 确 识 别 其 病 到叶脉、轮廓 等无 关因素 的 干 扰,使 识 别 难度加 大 [11]。
害种类并及时防 治,对 于 提 高 苹 果 的 产 量 和 质 量 至 关 在网络中添加注意力机制能够使其更 关 注 与 病 害特 征

2]
重要 。当前植物病害识别已成为 图 像 识别以及智慧 相关的细节 信 息,有 效 提 高 模 型 的 辨 识 能 力 [12 13]。 陆
农业领域内的重要研究方向 [3]。传统 的机 器学习算 法 雅诺等 [14]在 Re t 上 添 加 通 道 注 意 力 模 块,实 现 对
sNe
需要对图像经提 取 特 征 后 进 行 分 类,其 特 征 提 取 过 程 啤酒花的识别任务。但通道注意力机制 只在 图 像 的通

4]
耗时耗力,分类模型泛化能力弱、识别 效果 差 。卷积 道维度提取特征,而忽略了同一通道 不 同位置 的特 征。
神经网络(
Convo
lut
iona
lneur
alne rk,CNN)能 够
two 混 合 注 意 力 机 制 (Convo
lut
iona
lbl
ock a
tten
tion
自动提取图像特征,实现端到端的分 类识别,目前已 在 modu
le,
CBAM)通过将通道注意力模块和空间 注 意 力

5 10]
植物病害识别领域得 到 广 泛 应 用 。但随着网络深 模块融合,使模 型 训 练 时 能 同 时 兼 顾 特 征 图 的 空 间 和
度的增加,
CNN 在 训 练 过 程 中 易 出 现 梯 度 消 失、梯 度 位置因素,从而 更 全 面 地 对 病 斑 特 征 进 行 处 理。 王 粉
爆炸,导致网 络 收 敛 速 度 变 慢、网 络 退 化 等 问 题。 He 花等 [15]提出将I
3D 网 络 和 CBAM 融 合 用 于 识 别 动 态
等提出残差网络(
Res
idua
lNe rk,Re
two t),在残差
sNe 手势。李海 丰 等 [16]在 De t 中 加 入 CBAM 用
tMSPNe

收稿日期:
2021 年 9 月 29 日 修回日期:
2021 年 12 月 23 日
* 基金项目:山东省自然科学基金( ZR2019MF024);教育部科技发展中心产学研创新基金(2018A02010)
第一作者:于雪莹,女,1998 年生,山东潍坊人,硕士研究生;研究方向为图像处理。E-ma l:879591947@qq.
i com
通讯作者:王志强,男,
1977 年生,山东淄博人,博士,教授;研究方向为人工智能。E-ma
il:wz du
q@s t.
edu.
cn
第6期 于雪莹 等:基于生成对抗网络和混合注意力机制残差网络的苹果病害识别 167

于机场路面的识别。 其中,图 1(
a)为 黑 腐 病 叶 片,病 斑 中 部 凹 陷 呈 深
深度学习网络在病害识别过程中需要大量 训练 样 褐色;图 1(
b)为雪松锈 病 叶 片,表 面 接 近 枯 萎,有 大 量
本 图 像,以 防 止 模 型 在 训 练 过 程 中 出 现 过 拟 合 现 象。 浅褐色斑点;图 1(
c)为斑点落叶病叶片,病斑为橘红色
将数据集通过随机翻转、提高对比度、添 加噪声等方 法 小圆点;图 1(
d)为黑 星 病 叶 片,表 面 有 大 量 黑 色 斑 点;

17]
进行扩充,能 减 少 过 拟 合 现 象 的 出 现 ,但 这 些 方 法 图 1(
e)为健康叶片。
生成的样本数据不够丰富且图像特征与 原始数据集 区 2 生成对抗网络
1.

18] [ ]
分度较低 。 Good
fel
low 等 19 提 出 生 成 对 抗 网 络 GAN 由生成 器 G 和 判 别 器 D 两 个 部 分 构 成,其

Gene
rat
iveAdve
rsa
ria
lNe rks,GAN),通 过 生 成
two 结构如图 2 所示。生成器根据输入的随机噪声 z 得 到
器和判别器相互对抗生成丰富的样本图 像用于模 型 的 生成样本 G(
z),然后由判别器负责判 断 接受 的 数 据是
训练。熊方康等 [20]将 GAN 生成的训练集输 入改进 后 真实样本还是 生 成 样 本。 二 者 不 断 进 行 迭 代 优 化,在
的 VGG-16 模型,对土 豆、番 茄 等 农 作 物 病 害 进 行 识 相互对抗训练中使模型最终达到纳什平衡。
别。但 传统 GAN 在 训练过程中 采用的 损失 函数会导
致模型出现梯度 消 失,以 及 对 多 样 性 和 准 确 性 惩 罚 不
平衡造成的模型崩溃 [21]。 基 于 Wass
ers
ten距离的生

成 对 抗 网 络 (Wa
sse
rst
ein GAN, WGAN )采 用
Wa
sse
rst
ein 距离来 度 量 真 实 样 本 分 布 和 生 成 样 本 分
布之间的差异,使模型具有更好的稳 定性 和 收敛 速 度,
提高生成图像的质量和多样性 [22]。 图 2 生成对抗网络结构
针对上述问题,本 文 提 出 一 种 基 于 生 成 对 抗 网 络 F
ig.
2 Gene
rat
iveadve
rsa
ria
lne
two
rk mode
lst
ruc
tur

和混合注意力机 制 残 差 网 络 的 方 法。 采 用 WGAN 对 GAN 的目标函 数 用 于 保 证 判 别 器 能 够 判 断 样 本


原始数据集进 行 数 据 增 强,生 成 更 多 的 样 本 数 据。 对 的真假,生成器 能 够 不 断 优 化 网 络 从 而 生 成 更 多 真 实
残差网络的原始 残 差 块 进 行 改 进,并 嵌 入 混 合 注 意 力 1)所示。
样本,使图像越来越逼真。目标函数如式(
机制,使模型在 训 练 过 程 中 将 注 意 力 更 集 中 于 病 斑 区 nmaxV (
mi D,G)=Ex~Pd [
log(
D(x))]+
G D
域,对病害细节的分辨力更高。
Ez~Pg [
log(
1- D (
G(z)))]
1 材料与方法 (
1)
V(
式中: D,
G)———损失函数;
1 试验数据集
1.
Pd———真实样本分布;
试验以苹果健康叶片以 及 黑腐 病、雪 松锈 病、斑 点
落叶病和黑星病 4 种常 见苹 果病害 叶片 图像作 为研究 Pg———生成样本分布。
当 GAN 的真实样本 分 布 和 生 成 样 本 分 布 之 间 不
对象,图像分辨率统一设置为 100×100。样本数据来自
重叠时或重叠部分较少时,其等价 于 JS 散度的 目标 函

lan
tVi
ll
age公共数据集,原始图像 3207 张,包括健康
叶片 980 张,黑腐病 621 张,雪松锈病 275 张,斑点落叶 数会转化为固定 常 数,此 时 生 成 样 本 分 布 无 法 向 真 实

病 701 张,黑星病 630 张,典型样本如图 1 所示。 样本分布靠 拢 [23],导 致 训 练 过 程 中 出 现 模 式 崩 塌、梯


度消失等问题。采用 Wa
sse
rst
ein 距离代替 JS 散度对
GAN 进行优化,将目标函数约束到一个二 次 函 数的 范
围内,可 以 有 效 缓 解 梯 度 消 失 问 题,其 优 化 公 式 如 式

2)所示。


W(
Pd,
Pg)= x {
ma Ex~Pd [
D(x)
]-Ex~Pg [
D(x)
]}
a)黑腐病叶片 (
b)雪松锈病叶片 (
c)斑点落叶病叶片 D∈1-L
ips
chi
tz


2)
其 中,判 别 器 在 训 练 过 程 中 需 要 符 合 1 -
Lips
chi
tz 函数给定的约束范围。
Wa
sse
rst
ei 3)所示。
n 距离定义如式(

d)黑星病叶片 (
e)健康叶片 W(
Pd,
Pg)= i
nf 3)
E (x,y)~γ [‖x -y‖ ](
γ~ ∏ (
Pd,
Pg)
图 1 苹果各类叶片图像

ig.
1 App
leva
riousl
eafimage
s γ~ ∏ (
其中, Pd,
Pg)表 示 Pd 和 Pg 任 意 组 合 的
168 中国农机化学报 2022 年

x,
集合,从( y)~γ 中 采 样 分 别 得 到 一 个 真 实 样 本 x
和生成样本y,通过分布γ 对 样 本 距 离 ‖x -y‖ 的 期
望 值 E (x,y)~γ [‖ x - y ‖ ]取 下 界 得 到 的 即 为
Wa
sse
rst
ein 距离。
WGAN 模型及参数设置如图 3 所示。 其中,生成
器由 5 个反 卷积层(
Conv2DTr e)和 4 个 批归 一
anspos
化层 (
Bat
chNo
rma
liz
aton,BN)构 成,激 活 函 数 采 用

Le
akyRe
lu;判别器由 5 个 卷积层(
Conv2D)和 4 个 批
归一化层构 成,激 活 函 数 采 用 Le
aky Re
lu,由 Fl
att
en
层将数据进行一维化,最后由 Dens
e层输出判别结果。

图 4 残差块结构

ig.
4 Re
sidua
lst
ruc
tur

残差块的目标函数 H (
x)定义如式(
4)所示。
H(
x)=F(
x)+x (
4)
x———输入;
式中:
F(x)———残差函数。
Re t通 过 sho
sNe rt t将 拟 合 恒 等 映 射 函 数 转 化
cu
为学习一个残差函 数,即 当 F (
x)趋 向 为 0 时,就 构 成
了恒等映射 H (
x)=x。sho
rt t不 仅 解 决 了 模 型 训
cu

a)生成器
练的梯度消失、梯度爆炸问题,而且可 以在不 增 加运 算
量的同时加快训练速度。
4 混合注意力机制
1.
CBAM 由 通 道 注 意 力 模 块 (Channe
l At
ten
tion
Modu
le,CAM)和空间注意力模块(
Spa
rti
alAt
ten
tion
Modu
le,SAM)组 成,二 者 通 过 串 联 的 方 式 从 通 道 维
度和空间维度依 次 推 断 注 意 力 权 重,再 分 别 与 残 差 网
络的卷积结果相 乘 实 现 对 特 征 的 调 整,突 出 特 征 图 中
的目标特征,提高模型的识别性能和准确率。
1.1 通道注意力模块
4.
CAM 根据特征图 中 不 同 通 道 对 识 别 目 标 的 响 应
程度的依赖关系 进 行 建 模,根 据 响 应 程 度 的 不 同 对 特
征图 进 行 调 整,并 采 用 多 层 感 知 器 计 算 各 通 道 权

b)判别器 重 [25]。响应程度高的 通 道 表 示 与 识 别 目 标 相 似,分 配
图 3 WGAN 模型及参数设置 给较高权重;响 应 程 度 低 的 通 道 表 示 与 识 别 目 标 差 距

ig. landpa
3 WGAN mode rame
ters
ett
ings 较大,则分配给 较 低 权 重。CAM 结 构 如 图 5 所 示,实
3 残差网络
1. 现步骤如下:(
1)将输入特征图分别进 行 最大 池 化和 平
Re t通过恒等映射结构,采用 sho
sNe rt t将 多 个
cu 均池化,平均池化实现对通道特征的 压缩,最大 池 化 可
浅层网络连接起 来,有 效 解 决 了 深 层 网 络 在 训 练 过 程 以收集到目标的特征信息;(
2)池化后 的特 征 图 送入 由

24]
中出现的模型退化问题 。通过对 Re t的 原 始 残
sNe 全连接层、平均 池 化 层 和 最 大 池 化 层 构 成 的 多 层 感 知
差块进行改进,设 计 残 差 块 结 构 如 图 4 所 示。 该 残 差 器中进行参数共享;(
3)对多层感知器 输 出 结果 进行 对
块由卷积核大小分别为 1×1、
3×3、
1×1 的 卷 积 层 交 位相乘并求 和,然 后 通 过 s
igmo
id激活函数输出通道
替构成,并在卷积层之间分别插入 3 个批归一化层。 注意力特征图。
第6期 于雪莹 等:基于生成对抗网络和混合注意力机制残差网络的苹果病害识别 169

后,与 Re t的卷积 输 出 相 乘,并 将 得 到 的 结 果 作 为


sNe
SAM 的输入,然 后 将 输 入 特 征 图 再 与 下 一 次 Re
sNe

的卷积输出相乘 得 到 输 出 特 征 图,最 终 经 过 全 局 平 均
池化和全 连 接 层 输 出 病 害 分 类 结 果。CBAM 的 输 出
7)和式(
特征图 F″的计算公式如式( 8)所示。
图 5 通道注意力模块结构图
F′=M C (
F)⊗ F (
7)

ig.
5 Channe
lat
ten
tion modu
les
truc
tur

F″=MS (F′)⊗ F′ (
8)
通道注意 力 特 征 图 M C (
F )的 计 算 公 式 如 式 (
5)
所示。 F″———CBAM 的输出特征图;
式中:
⊗ ———元素乘法。
MC (
F)=σ{
MLP [AvgPol(
o F)]+
MLP [
MaxPool(F)]} (
5)
F ———输入特征图;
式中:
σ———si
gmo
id 激活函数;
MLP ()———多层感知器;
AvgPool()———平均池化;
MaxPo
ol()———最大池化。
1.2 空间注意力模块
4.
SAM 通过对特 征 图 的 空 间 维 度 信 息 进 行 特 征 提
取,加强网络对特征图像细节部分的关注和 学习,从而
实现对 CAM 的 补 充,其 结 构 如 图 6 所 示。 实 现 步 骤
如下:(
1)首先对输入特征图依次进行 最 大池化和 平 均
池化,并将得到 的 两 个 特 征 图 基 于 通 道 进 行 拼 接;(
2)
将拼接后的特 征 图 送 入 卷 积 层 中 进 行 特 征 提 取,再 通
过s
igmo
id 激活函数最终输出空间注意力特征图。

图 7 CBAM-Re
sNet网络结构图

ig.
7 CBAM-Re sNets
truc
tur
edi
agr
am

2 试验结果与分析

1 试验环境
2.
试验在 64 位的 Wi 10 操作系 统上 进 行,使用
ndows
图 6 空间注意力模块结构图
Py
thon 语言调用 ke
ras框架实现网络的构建、训练和测

ig.
6 Spa
tia
lat
ten
tion modu
les
truc
tur

试。服务器配置 16GBr am AMD Ry
zen536006 核处
空间注意力 特 征 图 MS (
F′)的 计 算 公 式 如 式 (
6)
理器和 16GBr
am Nv
idi
aGeFo
rc iGPU。
eGTX1660T
所示。
2 残差块结构优化
2.
MS (
F′)= σ{
f{[
AvgPo
ol(
F′);
MaxPo
ol(
F′)]}} 残差块结构由多个不同尺寸卷积 核 的卷 积 层 和批

6) 归一化层组合构 成,不 同 的 组 合 结 构 会 对 残 差 网 络 的
F′———SAM 的输入特征图;
式中: 收敛能力、训练 速 度 和 识 别 准 确 率 产 生 影 响。 为 确 定
f———卷积层运算。 最优结构,构建了如图 8 所示四种不同的残差块结构。
5 基于混合注意力机制的残差网络
1. 采用上述四 种 不 同 的 残 差 块 并 结 合 CBAM 搭 建
CBAM-Re sNet由 1 个卷积层、1 个批归一化 层、 模型,分别对病害图像进行训练,采用验 证 集 的 平均 准
3 个 convb
lock、
1 个全局平均 池 化 层 和 1 个 全 连 接 层 确率作为评价指 标,结 果 如 表 1 所 示。 残 差 块 d 相 较
构成,其结构如图 7 所示。其中,每个 convb
lock 均 由 于其他三种残差 块 对 病 害 的 准 确 率 最 高,因 此 采 用 残
3 个 卷 积 层、
3 个 批 归 一 化 层 组 成 的 残 差 块 和 CBAM 差块 d。在残差块 d 后嵌入 CBAM 的模型准确率达到
组成。输入图像 首 先 经 过 卷 积 层 进 行 特 征 提 取,得 到 77% ,效果较其他模型更好。因此,
93. convb
lock 在残
的特征图依次经过三个 convb
lock,然后经 CAM 操作 差块 d 的基础上嵌入 CBAM。
170 中国农机化学报 2022 年

3 模型超参数优化
2.
不同超参数的设置会对模型的训 练 速度和 泛 化能
力产生影响,采用单一因素法对 CBAM-Re t学 习
sNe
率、迭代次数和批量大小分别进行优 化,并采 用验 证集
准确率作为评价指标,结果如图 9 所示。
学习率表示模 型 权 重 更 新 的 速 率,设 置 学 习 率 在
0. 000001 的 范 围 内,得 到 模 型 准 确 率 如 图
0001~0.
( )
9 a 所示。结果表明,当学习率设置过大时,代价函数

a)1×1 卷积层 + 3×3 卷 (
b)3 个 1×1 卷积层 +
积层 +2 个批归一化层 3 个批归一化层 波动太大,试验结果不够准确,设置过 小 则 网 络 模型 收
敛效果不理想,导 致 训 练 时 间 增 加。 当 选 取 学 习 率 为
94% 。迭 代 次 数
00005 时,准确率达到最 高值 为 93.
0.
指模型进行完整 训 练 的 次 数,模 型 的 权 重 随 着 迭 代 次
数的增加 而 逐 次 更 新 迭 代,设 置 迭 代 次 数 分 别 为 5、
10、
15、
20、
25,得 到 模 型 准 确 率 如 图 9(
b)所 示。 当 选
取迭代次数为 15 时,模型训练已逐渐 稳 定且 此 时 准确
1% 。 批 量 大 小 影 响 模 型 的 优 化 程 度 和 速
率达到 93.
度,试验分别 设置批 量大 小 为 5、
10、
15、
20、
25,得 到 模
型准确率如图 9(
c)所示。当选取批量大小为 10 时,模
型在内存效率和 容 量 之 间 寻 找 到 最 佳 平 衡 点,此 时 准

c)4 个 3×3 卷积层 + (
d)1×1 卷积层 +3×3 卷积层 +
4 个批归一化层 1×1 卷积层 +3 个批归一化层
3% 。 通 过 试 验 证 明,CBAM -
确率达 到 最 高 为 94.
图 8 四种不同的残差块结构 Re t的学 习 率、迭 代 次 数 和 批 量 大 小 分 别 设 置 为
sNe

ig.
8 Fou
rdi
ffe
ren
tre
sidua
lbl
ocks
truc
tur
e 00005、
0. 15 和 10 时,模型性能最优。
表 1 不同残差块结构对模型的准确率对比
Tab.
1 Compa
ris
ono ft
hea
ccu
racyo
fdi
ffe
ren
tre
sidua
lbl
ocks
truc
tur
e mode
ls

准确率/%
残差块结构 是否嵌入 CBAM
黑腐病 雪松锈病 斑点落叶病 黑星病 健康 平均值

否 92.
46 89.
00 90.
70 88.
00 95.
10 91.
05

是 93.
00 90.
06 92.
47 90.
40 96.
62 92.
51

否 94.
08 92.
49 88.
28 89.
00 92.
04 91.
17

是 95.
00 93.
65 92.
51 90.
43 93.
70 93.
05

否 85.
50 93.
14 91.
40 94.
76 89.
12 90.
78

是 87.
49 94.
20 92.
81 95.
20 92.
30 92.
40

否 90.
30 96.
00 90.
50 91.
47 92.
00 92.
05

是 94.
61 94.
40 92.
75 93.
90 93.
20 93.
77


a)学习率的设置对试验结果的影响 (
b)迭代次数的设置对试验结果的影响 (
c)批量大小的设置对试验结果的影响
图 9 超参数的设置对试验结果的影响

ig.
9 I
nfl
uenc
eofhype
rpa
rame
ters
ett
ingsonexpe
rimen
talr
esu
lts
第6期 于雪莹 等:基于生成对抗网络和混合注意力机制残差网络的苹果病害识别 171

4 数据增强对模型识别效果的对比试验
2. 50000次迭 代 训 练,将 每 类 苹 果 病 害 图 像 均 扩 充 到
生成的图像效果及训练的l
oss曲线如图 10 所示。 2000张,将生成图像与原始 数 据 集 混 合 得 到 模 型 数 据
集,共 10000 张 样 本 图 像。 从 图 中 可 以 看 出,生 成 的
苹果叶片图像病 斑 特 征 明 显,且 不 同 病 害 之 间 有 明 显
区别。由l
oss曲线的变化趋势可以看出,WGAN 训练
前期生成图像 较 不 稳 定,存 在 噪 声。 当 训 练 次 数 达 到
50000 次左右,
l s曲线已趋于稳定,生成 的 样 本 图像
os
接近真实叶片图像。
为验证数据增 强 对 模 型 性 能 的 影 响,分 别 采 用 原

a)黑腐叶片 WGAN 后的l
oss曲线 始数据集和经过 WGAN 增强 后 的 数 据 集 对 CBAM-
Re t进行 训 练,采 用 测 试 集 的 准 确 率 作 为 评 价 指
sNe
标,结果如图 11 所 示。 图 11(
a)表 示 采 用 原 始 数 据 集
对模型进行训练,随着迭代次数的增 多,训练 集 和 测试
集准确率逐渐上升,在 8 次迭代之后 曲 线趋 于 平 稳,最
终测试 集 准 确 率 稳 定 在 92% 左 右;图 11(
b)表 示 采 用
WGAN 增强后的数据集对模型进行训 练,随着 迭 代 次
数的增多,模型的 训 练 集 和 测 试 集 准 确 率 迅 速 上 升,


b)雪松叶片 WGAN 后的l
oss曲线 次迭代之后曲线 已 趋 于 稳 定,最 终 测 试 集 准 确 率 达 到
50% 。 试 验 表 明,采 用 WGAN 进 行 数 据 增 强 能 够
95.
提高 CBAM-Re t的泛化能力和鲁棒性,使模 型 更
sNe
快地学习到病害特征,提高识别准确率。


c)班点落叶病叶片 WGAN 后的l
oss曲线


a)采用原始数据集对模型训练影响的准确率曲线


d)黑星叶片 WGAN 后的l
oss曲线


b)采用 WGAN 增强后的数据集对模型训练影响的准确率曲线
图 11 数据增强对模型训练影响的准确率曲线

ig.
11 Ac cu
racycu
rveoftheimpacto
fda
ta
( enhanc
ementon mode
ltra
ini
ng
e)健康叶片 WGAN 后的l
oss曲线
图 10 WGAN 生成的病害图像和l o
ss曲线 5 与其他网络模型性能的对比试验
2.

ig.
10 Di
sea
seimageandl
osscu
rvegene
ratedby WGAN 为验证 CBAM-Re t的有效性,将其与 4 种 传
sNe
采用 WGAN 对 模 型 训 练 样 本 进 行 扩 充,进 行 统 深 度 学 习 模 型 CNN、VGG -16、Re t-50、
sNe
172 中国农机化学报 2022 年


ncep
tion-V3 进 行 对 比,采 用 随 机 梯 度 下 降 法,使 用
WGAN 数据增强后 的 样 本 图 像 作 为 数 据 集 分 别 进 行
15 次迭代的 训 练,建立 测试集 混 淆矩阵如图 12 所 示,
其中颜色较深的对角线值代表模型对每 类病害的正 确
分类数量。CBAM-Re t对 各 类 病 害 的 平 均 正 确
sNe
分类 样 本 数 高 于 其 他 四 种 模 型。 以 雪 松 锈 病 为 例,
CBAM-Re sNet对雪 松 锈 病 的 误 分 个 数 为 4,误 分 率
为 2% ,而 其 他 四 种 传 统 模 型 误 分 率 分 别 为 5% 、 (
a)CNN
5% 、
7. 24% 、
3.5% ,均 高 于 CBAM - Re t的 误 分
sNe
率。试验结果表明,相较于其它深度学习模型,
CBAM
-Re t对苹果叶片各类病害的分类效果更好。
sNe
为进一步验证 CBAM-Re t的识别性能,采 用
sNe
准 确 率 (Ac
curacy )、精 准 率 (Pr
eci
sion )、召 回 率

Recal)和 F1-Sc
l ore 参数作为评价 标 准对五种模 型
进行性能对比,公式如下。
ncorrect
Ac
curacy = (
9) (
ntotal b)VGG-16

TP
Pr
eci
sion = ×100% (
10)
TP +FP
TP
Re
cal
l= ×100% (
11)
TP +FN
2×Prec
isi
on ×Recal

F1-Sc
ore= (
12)
Pr
eci
sion +Re
call
ncorrect———测试集中预测正确的样本数量;
式中:
ntotal———测试集总样本数量;

c)Re
sNe
t-50
TP ———真实的正样本数量;
FP ———真实的负样本数量;
FN ———虚假的负样本数量。
五种网络模型 对 苹 果 叶 片 病 害 的 识 别 性 能 结 果
如 表2 所 示 。 由 表2 可 以 看 出 ,
CBAM-Re t相 比
sNe
于 其 他 四 种 网 络 模 型 ,准 确 率 分 别 提 高 了 4.
45% ~
78% ,精 确 率 分 别 提 高 了 3.
7. 9% ~7.37% ,召 回 率 分
别 提 高 了 4.
32% ~7. 3% ,F1-Sc o
re参 数 分 别 提 高

d)I
ncep
tion-V3
了 0. 07,单 次 训 练 识 别 时 间 分 别 加 快 了19~75
04~0.
s。 因 此 ,
CBAM-Re t更 适 合 对 苹 果 叶 片 病 害 的
sNe
识别。
表 2 不同网络模型分类识别性能对比
Tab.
2 Pe
rformanc
ecompa
ris
ono
fdi
ffe
ren
tne
two
rk mode
ls

准确率 精确率 召回率 F1- 单次训练


模型
/% /% /% Scor
e 识别时间/s

CNN 85.
90 85.
60 85.
81 0.
86 60
VGG-16 87.
70 88.
03 88.
10 0.
88 54 (
e)CBAM-Re
sNe

ResNe
t-50 91.
00 92.
10 91.
08 0.
91 42 图 12 五种模型的分类混淆矩阵
Incept
ion-V3 88.
60 89.
00 88.
71 0.
88 98 F
ig.
12 Cl
ass
ifi
cat
ionc
onf
usi
on ma
tri
xfo
rfi
ve mode
ls
CBAM-Re
sNe
t 95.
50 95.
40 95.
40 0.
95 23 CAR、
注: BR、
AS、
AAB、
AH 分 别 代 表 雪 松 锈 病、黑 腐 病、黑 星 病、斑
点落叶病和健康。
第6期 于雪莹 等:基于生成对抗网络和混合注意力机制残差网络的苹果病害识别 173

6 特征图可视化分析
2. 过试验得出以下结论。
为直观地了 解 CBAM-Re t对 苹 果 病 害 的 识
sNe 1)对 ResNet 原 始 残 差 块 进 行 改 进,并 依 次 嵌 入
别机制,分别采 用 特 征 图 和 热 力 图 对 模 型 进 行 可 视 化 CAM 和 SAM,提出一种 基 于 混 合 注 意 力 机 制 CBAM
分析,结果如图 13 所示。选取模型的第 一层卷积层 输 的改进模型 CBAM-Re sNe t,使 模 型 更 关 注 叶 片 中 的
出特征图,并采用 Gr
ad-CAM 输 出 热 力 图。 由 图 13 病斑区域,防止叶 脉、轮 廓 等 背 景 产 生 干 扰,解 决 了 传
可以看出,在特征图中病斑区域呈现 黑色或 深绿 色,未 统网络对苹果叶片病害识别时准确率不高的问题。
患病区域呈现黄 色 或 浅 绿 色,热 力 图 中 病 斑 区 域 相 较 2)CBAM - Re t 相 较 于 CNN、VGG -16、
sNe
于未患病区域呈现高亮特征,说明 CBAM-Re t对
sNe Re
sNet-50、
Inc
ept
ion-V3 四种 传 统 模 型,准 确率 分 别
叶片图像中不 相 关 的 背 景 信 息 关 注 更 少,模 型 更 聚 焦 提高 了4.45% ~7.78% ,精 确 率 分 别 提 高 了 3.
9% ~
于叶片的病斑区 域,能 有 效 提 取 患 病 叶 片 中 的 病 斑 区 37% ,召回率分别提高了 4.
7. 3% ,
32%~7. F1-S
coe参

域作为识别特 征,从 而 获 得 更 高 的 识 别 准 确 率。 健 康 数分别提高了 0. ,
07 单次训练识别时间分别加快
04~0.
叶片无病斑特征,模 型 识 别 时 则 以 其 轮 廓 作 为 分 类 依 了 19~75s,因此更适合进行苹果叶片病害的识别。
据。试验结果表明,
CBAM-Re t可 以 更 好 地 发 现
sNe 3)采用 WGAN 进行数据增强有效地扩充了 原 始
叶片图像中的 病 斑 区 域,从 而 对 苹 果 叶 片 病 害 进 行 准 数据集,解决了训练样本数据量不足 和不 均 衡 的 问题,
确识别。 使模型准确 率 从 92. 50% 。 因 此,采 用
43% 提 升 至 95.
WGAN 进行数据增 强 能 够 提 高 模 型 的 泛 化 能 力 和 鲁
棒性,从而提升模型的识别准确率。
4)由于 WGAN 训 练 过 程 有 一 定 不 稳 定 性,在 生
成的样本图像中存在少数不符合叶片 特征 的 图 像。 因
此,如何进一步优 化 WGAN 生 成 的 样 本 图 像,减 少 含
有噪声的叶片图像数量成为接下来的研究方向。

参 考 文 献


1]李光涛 .浅 议 苹 果 种 植 与 病 虫 害 防 治 技 术 [
J].山 西 农 经,
2020(
23):87-88.

2]王东方,汪军 .基 于 迁 移 学 习 和 残 差 网 络 的 农 作 物 病 害 分
J].农业工程学报,2021,37(
类[ 4):199-207.

3]张善文,张晴 晴,李 萍 .基 于 改 进 深 度 卷 积 神 经 网 络 的 苹
J].林业工程学报,2019,4(
果病害识别[ 4):107-112.

4]Kau
rR,Kang S S.Anenhanc
emen
tinc
las
sif
iersuppo
rt
ve
ctr ma
o chi
ne t
o imp
rove p
l td
an i
sea
se de
tec
tion [C].
IEEEI
nte
rna
tiona
lCon
fer
enc
eon Moo
c IEEE,2016.
s.

5]Kr
izhe
vsky A, Su
tske
ver I, Hi
nton G E.ImageNe


las
sif
ica
tion wi
thde
epc
onvo
lut
iona
lneu
ralne
two
rks [
J].
Commun.ACM,2017,60(
6):84-90.

6]郭小清,范涛杰,舒欣 .基于改进 Mu
lti-Sc
aleAl t的番
exNe
茄叶部病 害 图 像 识 别 [
J].农 业 工 程 学 报,2019,35(
13):
162-169.

7]许景辉,邵明烨,王一琛,等 .基于迁移学习的卷积神经网
络玉米病害 图 像 识 别 [
J].农 业 机 械 学 报,2020,51(
2):
230-236,253.

8]杨明欣,张耀 光,刘 涛 .基 于 卷 积 神 经 网 络 的 玉 米 病 害 小
图 13 可视化分析结果

ig.
13 Vi
sua
lana
lys
isr
esu
lts J].中国生 态 农 业 学 报 (中 英 文),2020,28
样本识别研究[

12):1924-1931.
3 结论 [
9]陈桂芬,赵姗,曹丽英,等 .基于迁移学习与卷积神经网络
J].智慧农业,2019,1(
的玉米植株病害识别[ 2):34-44.
针对苹果病害 的 识 别 问 题,本 文 提 出 一 种 基 于 生 [
10]龙满生,欧阳春娟,刘 欢,等 .基 于 卷 积 神 经 网 络 与 迁 移
成对抗网络和混 合 注 意 力 机 制 残 差 网 络 的 方 法,并 通 学习的油茶病害图像识别[
J].农 业 工 程 学 报,2018,34
174 中国农机化学报 2022 年


18):194-201. I
nfo
rma
tionPr
ocess
ingSy
stems,2014,3:2672-2680.

11]王美华,吴振鑫,周祖光 .基于注意力改进 CBAM 的农作 [
20]熊方康,陆玲,曹廷荣,等 .基 于 生 成 对 抗 网 络 的 农 作 物
物病虫害细 粒 度 识 别 研 究 [
J].农 业 机 械 学 报,2021,52 叶片病害识别[ J].计算机与现代化,2020( 11):39-46.

4):239-247. ongFangkang,LuL
Xi ing,CaoTi
ngong,e
r tal.
Cropl
eaf

12]乔思波,庞善臣,王敏,等 .基 于 残 差 混 合 注 意 力 机 制 的 di
se a
sesrec
ogni
tion: a gene
rat
ive adve
rsar
ial ne
twork
脑部 CT 图 像 分 类 卷 积 神 经 网 络 模 型 [
J].电 子 学 报, basedapp
roach [
J].Compu terand Modern
izat
ion,2020
2021,49(
5):984-991. (
11):39-46.

13]尚远航,余游江,吴刚 .基于 混 合 注 意 力 机 制 的 植 物 病 害 [
21]胡龙辉,王朝立,孙占全,等 .基于 WGAN 的图像识别方
识别[ J].塔里木大学学报,2021,33( 2):94-103. 法[J].控制工程,2020,27(
12):2168-2175.

14]陆雅诺,陈炳才 .基于注意力机制的小样本啤酒 花 病 虫 害 HuLonghui,Wang Chao
li,Sun Zhanquan,e
tal.Image
J].中国农机化学报,2021,42(
识别[ 3):189-196. Re
cogn
iti
on wi
t [ ]
h WGAN J .Con tr
ol Eng
ine
eri
ng of
Lu Ya
nuo,Ch
enB
ing
cai.I
den
tif
ica
tion o
f hop
spe
stsa
nd Ch
ina,2020,27(
12):2168-2175.

ise
assi
e nsma
llsample
sb a
sedonatt
ent
iona
lme c
han
isms [
J]. [
22]邓源,施一萍,刘婕,等 .结合双 通 道 WGAN-GP 的 多 角

our lo
na fChine
s e Agr
icul
tur
al Mechan
izat
i , ,
on 2021 42 度人脸表情识别算法研究[ J/OL].激光与 光 电 子 学 进 展:

3):189-196. 1-19[ 2022-04-08].h tp://kns.cnk
t i.ne
t/kcms


15]王粉花,张强,黄超,等 .融 合 双 流 三 维 卷 积 和 注 意 力 机 de
tai/
l31. 1690.
tn.
20210816.1359.
034.html
制的动态手势 识 别 [J].电 子 与 信 息 学 报,2021,43( 5): [
23]Arov
j sky M,Bottou L.Towardsp
rinc
ipled me
thodsf
or
1389-1396. t
rai
ning gene
rat
ive adve
rsa
ria
l networks [J].S tt,


16]李海丰,韩红阳 .复杂背景下机场道面细带状结 构 病 害 检 2017,1050.
测算 法 [ J].北 京 航 空 航 天 大 学 学 报,2022,48(
1): [
24]刘璐,李建强,陈适 .基于混 合 域 注 意 力 机 制 和 残 差 网 络
36-44. 的 特纳综合征分类研究[J].中国数字医学,2021,16( 2):

17]郑一力,张露 .基于迁移学习的卷积神经网络植物叶片图像 16-20.
识别方法[ J].农业机械学报,2
018,4
9(1):3
S 54-3
59. LiuLu,LiJ
ianq
iang,ChenSh
i.Ac
las
sif
ica
tion me
thodo


18]陈佛计,朱枫,吴清潇,等 .生 成 对 抗 网 络 及 其 在 图 像 生 t
urner synd
rome based on mixed doma
in at
tent
ion
成中 的 应 用 研 究 综 述 [
J].计 算 机 学 报,2021,44(
2): mechan
ism and r
esi
dual ne
twok [J].Ch
r i
na Di
gita

347-369. Medi
cine,2021,16(
2):16-20.
ChenFoi,Zhu Fe
j ng,Wu Qi
ngx
iao,e
tal.A s
urv
eya
bou
t [
25]朱 文 球,邹 广,曾 志 高 .融 合 层 次 特 征 和 混 合 注 意 力 的 跟
imagege
ner
ati
onwi
thgenera
tiv
eadver
sar
ialn
ets[
J].
Chi
nes
e 踪算法[ J/OL].计算机应用:1-14[ 2022-04-08].
Jou
rnalo
fComput
ers,2021,44(2):347-369. h
ttp://kn
s.c
nki.
ne/k
t /d
cms e
tai
l/51.
1307.TP.
20210817.

19]Goodf
elow I J, Pouge
l t-Abad
ie J, Mirza M, eta l. 1011.
002.
html
Gene
rati
veadve
rsa
ria
lnetworks [
J].Advance
sin Neu
ra l

App
led
ise
aser
eco
gnit
ionba
sedon Wasse
rst
eing
enera
tiv
eadvers
ari
aln
etwo
rksand
hybri
dat
tent
ion me
chani
smresi
dualnetwo
rk

YuXuey
ing,GaoJ
iyong,WangShoucheng,L
iQi heng,WangZh
ngs iqi
ang

Col
legeof Compu
terSc
ienc
eand Te
chno
logy,Shandong Un
ive
rsi
tyof Te
chno
logy,Zi
bo,255049,Ch
ina)

Ab
str
act:I
tisimpo
rta
ntt
oid
ent
ifya
ndc
ont
rolt
hed
ise
asea
ccu
rat
elyt
oimp
rov
eth
eyi
elda
ndqu
ali
tyo
fa l
ppes.Aimi
nga
tth
epr
obl
emo
flow

ecogn
iti
onacc
urac
yo fa l
ppedi
sea
seima
g e
scause
dbysmal
lles
ionar
easandeasyb
ackgr
oundi
nte
rfe
ren
ce,aConvo
luti
onalBl
ock At
tent
ion
Modul
e-Res
idua
lNe two
r (
k CBAM-Re sNe )
t mode
lwasdes
igne
d.This mod
elembedd
edatandem c
hann
elat
ten
tion modu
leands a
ptia


tte
ntion modu
lei
ntheresi
dualne
twor
ks otha
tt he mode
lcanfoc
usont hedi
sea
sedareasofima gefea
ture
sa ndimprovethere
cogni
ti
on

ccura
c y.Aimi
ngatth
e r
poblemth
atth
e numbe
r o
f sampl
esinth
e mod
eltr
ain
ingdat
ase
t i
s i
nsu
ffi
cie
nt a
n dimbal
ance
d ,t
his aer r
pp p po o
seda
met
hodfordat
asetexp
ansionb
ase
don Was
sers
tein Ge
ner
ativ
e Adv
ersar
ialNetwor
ks (WGAN).Th
roughtheant
agon
ist
ictr
ain
ingbetwe
en

gnera
toranddi
scr
imina
tor,10000a
ppledi
seaseimages wer
egener
ated,and CBAM-RESNET wa str
aine
da ndte
stedtoimpr
ov et
he
gen
era
li
zat
ionab
il
ityandrobustn
essoft
hemod
el.
Theexpe
rimen
talr
esu
ltsshowedt h
atcompa
redwit
htr
adi
ti
ona
lmo d
elss
uchasCNN,VGG-
16,ResNet-50,a ndIn
c et
pion- V3,CBAM-Re sNe
th adab e
tte
rr e
c ogn
iti
one f
fec
tona l
ppedi
sea
ses,anditsrec
ogn
iti
ona
ccu
ray,


pec
ison,r
i eca
ll,a
ndF1-S
cor
ere
ach
e 50% ,95.
d95. 40% ,95.
40% ,a
nd0.
95.Th
e me
thodc
a r
npov
idet
echn
ica
lsuppo
rtf
ora
ccu
rat


dent
if
ica
tionandre
al-t
imemonit
ori
ngo fa l
ppedi
sea
seimae
gs.
Keywors:a
d ppl
edi
sease;ima
gerecogn
iton;g
i e
nera
tiv
eadver
sar
ialn
etwo
rks;r
esi
dua
lne
two
rk;c
onv
olu
tion
alb
loc
kat
ten
tion modu
le

You might also like