Professional Documents
Culture Documents
基于对抗式生成网络的农作物病虫害图像扩充
林胜 巩名轶 牟文芊 董伯男
(山东农业大学信息科学与工程学院 山东省泰安市 271000)
1 引言
140
电子技术与软件工程 计算机与多媒体技术
Electronic Technology & Software Engineering Computer And Multimedia Technology
2.2 DCGAN基本原理及特点
DCGAN 将卷积运算的思想引入到生成模型中来做无监督训练,
利用卷积网络强大的特征提取能力,提高了生成样本质量收敛速度,
有效解决对抗式生成网络在无监督学习方面的不足。DCGAN 模型
有以下特点:
(1)该网络模型去除全连接层,直接用卷积层连接生成器和 图 4:生成器结构
判别器的输入和输出层。
(2)取消所有特征提取层(pooling),在 Generator 网络中使
用转置卷积进行上采样,在 Discriminator 网络中用加入 stride 的卷
积代替 pooling。
(3)在 Generator 网络中使用 Relu 作为激活函数,最后一层
使用 tanh,在 Discriminator 网络中使用 LeakyRelu 作为激活函数。
(4)在 Generator 和 Discriminator 上都使用 batchnorm 批标准 图 5:生成器和判别器损失函数
化一定程度上解决初始化差的问题、帮助梯度传播到每一层、防止
Generator 把所有的样本都收敛到同一个点。
经典 DCGAN 的生成器 如图 2 所示。
3 基于深度对抗式生成网络的农作物病虫害图像的生成
基于深度卷积生成式对抗网络生成图像通常需要四个步骤:
(1)收集和预处理训练数据;
(2)基于深度卷积对抗式生成网络构建生成器和判别器; 图 6:生成茶叶病害图像
(3)训练生成器和判别器;
1 维的结果。
(4)利用训练好的生成网络生成农作物病虫害图像。
3.3 DCGAN模型训练
3.1 病虫害图像预处理
本论文工作基于深度卷积对抗式生成网络实现农作物病虫害
该实验病虫害图像由本团队在多个农作物生长周期期间采集的
图像的扩充,训练时使用 Adam 方式进行梯度下降,学习率为:
包括茶叶、小麦、花生等十几种农作物的几十种病虫害的近万张图
learning_rate=0.001,mini-batch 为 128,每层的输出结果进行批量
片。该实验计划以茶叶病虫害图像为真实图像,并对其进行归一化
归一化(Batch Normalization,BN)[9] 处理,使图像数据分布一致,
处理,将其处理为 256×256 像素,得到训练样本如图 3 所示。
增加训练网络模型更加容易和稳定。生成器的转置卷积层中使用
3.2 DCGAN网络模型建立
Relu 函数作为激活函数,判别器中卷积层使用 LeakRelu 函数作为
DCGAN 的生成器模型如图 4 所示,100 维噪声作为输入,通 激活函数,迭代 200 个周期,输出图像大小为(256,256,3)。
过一个全连接层进行维度转换成(8,8,512)的三维张量,之后通
3.4 实验结果分析
过两个卷积核为 3×3 像素步幅为 2 的转置卷积层输出(32,32,
由图 5 可以看出 DCGAN 生成器和判别器在训练初期由于各自
128)的三维张量,经过卷积核为 3×3 像素步幅为 4 的转置卷积层,
的生成能力和判别能力都较弱 , 损失函数值变化较大。但随着训练
输出再次经过 3×3 像素步幅为 2 的转置卷积层输出(256,256,3)
次数的增加,生成器和判别器的能力逐渐增强,判别器和生成器的
的三维张量,tanh 激活,即生成一个图像样本。
损失函数 Loss 在逐步下降,最终两者在较小的范围内波动。这也
DCGAN 的判别器模型结构如图 4 所示,判别器以(256,256,3)
表明该模型训练正常,未发生异常情况。最终生成茶叶病害图像如
的三维张量作为输入,经过一个卷积核为 3×3 像素步幅为 2 的卷积
图 6 所示。
层输出维(128,128,32)的三维张量,然后经过卷积核为 3×3 像素
4 结束语
步幅为 4 的卷积层,输出再次经过两个卷积核为 3×3 像素步幅为 2
的卷积层输出(4,4,512)的三维张量,最后通过一个全连接层输出 DCGAN 结合了 CNN 和 GAN 模型各自的优点,可以从物体或
141
计算机与多媒体技术 电子技术与软件工程
Computer And Multimedia Technology Electronic Technology & Software Engineering
基于深度学习的车辆跟踪算法综述
赵奇慧 刘艳洋*
(智慧互通科技有限公司静态交通技术创新中心 河北省张家口市 075000)
摘 要:本文首先介绍了深度学习中用于车辆跟踪的神经网络模型,以及通过这些网络模型衍生的基于预训练、在线训练和离线训练
的跟踪算法,同时列举了车辆跟踪相关数据集和评价标准,最后对目前车辆检测中待解决的问题、未来待改进的方向进行了分析和讨论。
关键词:图像处理;目标识别;车辆跟踪;卷积神经网络(CNN)
142