Professional Documents
Culture Documents
3
2020 年 5 月 Journal of Guangdong University of Technology May 2020
doi: 10.12052/gdutxb.190157
基于Inception与Residual组合网络的
农作物病虫害识别
冯 广,孔立斌,石鸣鸣,贺敏慧,何雅萱
(广东工业大学 自动化学院,广东 广州 510006)
摘要: 针对我国农作物病虫害识别方法中存在的速度慢、主观性强、所需专业知识要求高以及识别成本高等问题, 提
出一种基于Inception与Residual结构组合的Inception-resnet-v2网络模型的农作物病虫害识别方法, 以实现精准高效的农
作物病虫害识别。网络使用residual结构, 采用跨层连接方式将低层特征与高层特征进行组合学习以增加网络深度。
同时加入了Inception结构, 既能保持网络结构的稀疏性, 又能利用密集矩阵的高计算性能, 加快了训练速度。最后通过
Softmax分类器进行多分类预测。与传统方法相比, 本文方法收敛速度更快, 不仅准确率达到96.67%、精确度达到
90.77%、召回率达到89.72%, 还使病虫害识别的不同类别更加均衡, 改善了传统方法中对特定类别识别效果差的问题。
关键词: 农作物病虫害识别;Inception结构;Residual结构;Inception-resnetl-v2;Softmax分类器
中图分类号: TP391.41 文献标志码: A 文章编号: 1007–7162(2020)03–0017–06
Abstract: Aiming at the problems of slow speed, subjectivity, high requirement of professional knowledge and
high recognition cost in the identification methods of crop pests and diseases in China, a crop pest and disease
identification method is proposed based on Inception-resnet-v2 network model combining Inception and Residual
structure. To achieve accurate and efficient crop pest identification, the network uses a residual structure to combine
low-level features with high-level features to increase network depth. At the same time, the Inception structure is
added, which not only maintains the sparsity of the network structure, but also utilizes the high computational
performance of the dense matrix to speed up the training. Finally, the multi-class prediction is performed by the
Softmax classifier. Compared with the traditional method, the proposed method converges faster, not only with an
accuracy rate of 96.67%, but also with an accuracy of 90.77% and a recall rate of 89.72%. It also makes the
different categories of pest and disease identification more balanced, improving the specific methods in the
traditional methods, by which the recognition effect is poor.
Key words: crop pest recognition; Inception structure; Residual structure; Inception-resnetl-v2; Softmax classifier
收稿日期:2019-12-17
基金项目:国家自然科学基金资助项目(70971027)
作者简介:冯广(1973–),男,高级工程师,博士,主要研究方向为网络控制、机器学习、大数据
18 广 东 工 业 大 学 学 报 第 37 卷
区域,这一步是与识别无关的耗时步骤,为了避免候
选区域的提取耗时过多,一种端到端的识别方法陆 Inception-ResNet-v2预处理
续提出。Cirshick等[8]提出一种端到端的快速区域卷
积神经网络,将整个图像归一化后直接送入CNN网 目标的特征图模型
络,卷积层不进行候选区的特征提取,而是在最后一
个池化层加入候选区域坐标信息,进行特征提取的 特征图展开成一维向量
计算,加快了识别速率。Liu等[9]提出一种单点多盒探
测器的方法,把不同卷积核用于不同的宽高比进行 Softmax算法
识别,然后将特征图用于网络高层的多个特征映射
当中,采用多尺度特征映射用于识别。而面对农作物 输出病虫害检测结果
病虫害的识别任务中,当新增种类时便需要模型迁
图 1 农作物病虫害识别流程
移训练,这就要求模型的训练速度要快。同时对于类
Fig.1 Crop pest and disease identification process
第3期 冯广,等:基于Inception与Residual组合网络的农作物病虫害识别 19
2 病虫害图像特征提取网络 ReLu激活
提取农作物病虫害图像的特征以及学习相应的 +
1×1卷积
(384维输出)
图像模式是农作物病虫害算法实现敏感识别和精准
1×1卷积
分类的关键。为了可以提取更高级的病虫害深度特 (64)
在于Inception结构卷积核的大小和数量不同。对于
Softmax
Inception-resnet-A块,首先输入上一个深度网络层输 降维
出的病虫害特征映射,Inception结构有3路卷积通道, 降维
分别提取出尺寸相同通道数不同的特征映射进行堆
叠,然后对堆叠后的特征映射进行卷积得到Inception
结构的输出特征,通过残差连接与输入特征映射相
ReLu激活
加,最后通过激活函数得到这个块提取的病虫害更 ReLu激活
高级的特征映射。以水稻稻瘟病为例,通过Inception- +
resnet-A块把纹枯病的低级特征映射高度抽象得到 1×1卷积 +
(896维输出) 1×1卷积
高级特征映射如图3所示。网络的特征提取核心结构 (1 792维输出)
由Inception-resnet-A/B/C块组成,该结构由一系列卷 7×1卷积
(128) 3×1卷积
积和残差连接实现,公式为 (192)
( ( ) ) 1×1卷积 1×7卷积
×10
xb = f hk xb−1 + xb−1 , k = A, B,C (1) (128) (128) 1×1卷积 1×3卷积
(192) (192)
×5
m 1×1卷积
∑
l
(128) 1×1卷积
Anl = f i ∗ Wn + bn
Al−1 l
(2) (192)
i=1
ReLu激活 ReLu激活
其中, xb表示第b个Incepption-resnet块输出的特征映
Inception-resnet-B Inception-resnet-C
射;hk (x) 表示Inception-resnet-K块提取的特征映射。
图 2 病虫害特征提取网络
Aln 是第l 层卷积网络的第n个输出特征映射;函数 f 为
Fig.2 Pest and disease feature extraction network
i 为第l − 1层卷积网络的第i 个输出特征
激活函数; Al−1
映射;Wnl 为第l 层卷积网络的第n个卷积核权重;参数 3 病虫害识别过程
bln是第l 层卷积网络的第n个特征映射的偏置。
对原始图像进行亮度归一化[13]预处理后,输入
通过Inception-resnet结构提取的病虫害高级特
到Inception-resnet-v2网络对农作物病虫害图像采用
征,存在邻域大小受限造成的估计值方差增大,为了
端到端的方式直接提取从低级到高级的特征,得到
缩小该误差,使用平均值池化卷积层输出的病虫害
特征映射后再通过平均池化层进行池化,池化输出
特征映射。池化特征映射表达式为
( ) 后将特征映射进行一维展开得到相应的特征向量,
fu,v = Avg Srn{i+(u−1)×d, j+(v−1)×d} (3) 最后将特征向量通过分类器进行农作物病虫害分类。
其中,i 和 j 表示卷积网络的池化核的维度;Srn 表示经 由于农作物病虫害种类多,而且类别之间相似
过Inception-resnet块运算得到的第n个病虫害特征映 度较高,容易造成误分类。本文选用多类别分类的
射,d 表示池化步长; fu,v 表示池化后得到的特征,参 Softmax分类器,它是由逻辑回归分类器的基础发展
数u 和v 是特征维度。 而来,能够一次完成对多个类别的分类任务。
20 广 东 工 业 大 学 学 报 第 37 卷
∑
c θ j x(i)
其中, e 对概率值进行归一化,使得所有概率之
j=1
和为1;θ j 维度为1 × 1 536,是Softmax分类器的第 j 个
输入节点权重,同时使用θ 表示全部参数,该矩阵是
将θ1 , θ2 , · · · , θc 按行排列得到,维度为c × 1 536 ,θ 可表
示为θ = [θ1 , θ2 , · · · , θc ]。
Softmax分类器的损失函数是对函数中类别标
记的c 个概率值进行累加,公式为
1 ∑
m ∑
c
L(θ) = −
1(y(i)
= j) ln(P(y (i)
= j|x(i)
; θ))
(5)
m
i=1 j=1
(a) 低级特征映射
4 实验与分析
4.1 农作物病虫害数据集
本文实验采用的数据集来源于农业病虫害研究
图像数据库(Image Database for Agricultural Diseases
and Pests Research,IDADP)[14],IDADP包含大量的水
稻、小麦、玉米等作物病害图像资源,每种病害有几
百乃至上千幅图片,其原始图片分辨率达到2 000万
像素,建立了一个可为机器学习建模提供训练和测
试样本的农作物病虫害识别研究图像数据集。本文
选取水稻和小麦作为研究对象,每个研究对象各选
取3种常见的病虫害类别,共6个类别,分别水稻白叶
枯病、水稻胡麻斑病、水稻稻瘟病、小麦白粉病、小麦
赤霉病、小麦叶锈病,其中水稻每个类别600张图片,
小麦每个类别400张图片,共计3 000张图片用于训练
加验证,另外有单独300张用于测试。每一张样本图
片分辨率为3 000×2 000×3。部分样本示例如图4
(b) 高级特征映射 所示。
图 3 水稻稻瘟病低级特征到高级特征
Fig.3 Low-grade to advanced features of rice blast
经过特征提取网络提取后输出的第i 个样本特
征向量 x(i) ,向量表示为1 536 × 1。本文将病虫害特征 水稻纹枯病 水稻胡麻斑病 水稻稻瘟病
向量 x(i) 与病虫害图片标签值作为Softmax分类器的
输入,分别表示为{x(1) , x(2) , · · · , x(m) }与y(i) ∈ {1, 2, · · · , c},
其中m为样本数,c 为类别数,本文取值为c = 6。因此,
针对给定的输入样本 x(i) ,归一化为每一个类别的概 小麦白粉病 小麦赤霉病 小麦叶锈病
率值P 可表示为
图 4 水稻与小麦的图像样例
θ j x(i) Fig.4 Samples of images of rice and wheat
e
P(y(i) = j|x(i) ; θ) = , j = 1, 2, · · · , c (4)
∑
c θ j x(i)
e 本实验的实验平台为Ubuntu16.04操作系统,
j=1
32 GB RAM,CPU处理器主频为3.7 GHz,GPU为
GTX1060,深度学习框架为Pytorch1.1.0。
第3期 冯广,等:基于Inception与Residual组合网络的农作物病虫害识别 21
训练过程中,为了更明显地进行对比,本文选用 90
CNN和DCNN两种传统网络与本文方法进行对比, 80
均使用Adam优化器进行参数更新,损失函数为交叉 70
训练准确率/%
熵(Cross Entropy, CE)函数。其中Adam学习率初始化 60
为10−3,权重衰减为10−4 。每一次迭代完成都使用一 50
次验证集进行验证,当连续3次迭代完成的损失都没 40
本文
有下降时则将学习率缩小10%。测试集用来对模型 30
DCNN
进行最后的评估。 20 CNN
10
4.3 效果对比
为了验证本文方法的有效性,本文采用传统神 0 50 100 150 200 250 300
经网络和深度卷积神经网络方法对农作物病虫害识 迭代次数
别做实验对比,评价指标包括准确率、精度、召回率 图 5 模型迭代曲线
程迭代次数的平均准确率发现,本文方法在迭代约 的网络能达到94.56%的平均准确率。而本文方法引
200次后,随着迭代次数的增加,准确率基本保持不 入了残差连接,在深度一定的情况下有效的缓和过
变并趋于稳定,而DCNN和CNN还未收敛。表明本文 拟合,准确率达到了96.67%,比没有残差结构的
方法在训练过程中具有较快的训练速度。 DCNN多2.11%的准确率。
表 1 平均准确率对比 由表2可知,不同模型对不同类别的识别效果有
Table 1 Mean accuracy comparison %
明显差异,CNN对稻瘟病的识别准确率与赤霉病识
模型 训练集 测试集 别准确率相差达到23.66%,对稻瘟病的识别表现最
CNN 82.69 79.56
差,存在明显的识别不均衡现象。本文方法的各个类
DCNN 98.76 94.56
别的识别准确率均匀,而且每个类别的识别准确率
本文 96.75 96.67
比DCNN高。
表 2 特定类别的识别准确率对比 由表3可知,本文方法的模型精度(precision,预
Table 2 Comparison of recognition accuracy for specific categories 测为正的样本当中真实为正的比例)达到90.77%,在
%
预测的正样本中准确率最高。同时,本文方法的召回
类型 CNN DCNN 本文
率(recall,真实为正的样本中被预测正确的比例)为
纹枯病 77.00 89.67 93.67
89.72%,在样本中找到各个病虫害类别的能力最强。
胡麻斑病 75.00 94.33 97.00
稻瘟病
本文方法的F1分数(score,对精度和召回率的调和平
64.67 91.67 96.00
白粉病 85.67 94.67 94.67 均:F1=2(precision×recall)/(precision+recall))体现了召
赤霉病 88.33 99.67 100.00 回率和精度的调和平均,统计结果为90.24%,模型综
叶锈病 86.67 97.33 98.67 合表现最好。病虫害的识别模型指标统计结果表明,
CNN模型并不能很好地提取不同病虫害类型的特
表 3 精度、召回率和F1分数
Table 3 Precision, Recall and F1 score % 征,DCNN由于其结构限制,存在收敛慢、过拟合等
现象导致综合指标不高,而基于本文方法的病虫害
指标 精度 召回率 F1分数
CNN 34.17 38.33 36.13
识别模型可以较好地提取不同类型的病虫害特征,
DCNN 85.41 84.17 84.79 能够获得很好的病虫害识别效果。
本文 90.77 89.72 90.24
5 结语
通过表1可知,在包含水稻和小麦的共6种类型 本文提出的基于Inception和Residual结构组合的
农作物的病虫害识别任务中,传统的CNN算法表现 Inception-resnet-v2网络的农作物病虫害识别分类方
最差,测试平均准确率仅为79.56%。DCNN通过更深 法在面向多类别的任务中,不仅有效提升了识别准
22 广 东 工 业 大 学 学 报 第 37 卷