You are on page 1of 5

小 型 微 型 计 算 机 系 统 2021 年 9 月 第 9 期

Journal of Chinese Computer Systems Vol. 42 No. 9 2021

卷积神经网络在图像识别中的应用研究综述
盖荣丽 ,蔡建荣 ,王诗宇 ,仓 艳 ,陈
1 1 2,
3 1 1

1
( 大连大学 信息工程学院,大连 116622)
2
( 中国科学院大学,北京 100049)
3
( 中国科学院 沈阳计算技术研究所,沈阳 110168)
E-mail: gairli@ sict. ac. cn

摘 要: 卷积神经网络出现之前图像识别方法主要依赖人工设计特征,而这样的特征只能表征图像中的中低级信息,难以提取
图像的深层次信息. 卷积神经网络通过建立深度神经网络来模拟人脑分析、学习和解释数据,具有强大的表达能力和泛化能力,
能够更好地表示图像的深层次信息. 开展基于卷积神经网络对图像识别进行研究可以推动计算机领域的发展. 本文先对卷积神
经网络做一个概述,重点综述了卷积神经网络相关算法在人脸识别、人体动作识别、医疗图像处理和农业病虫害识别方面的应
用及其优缺点,最后探讨了卷积神经网络在图像识别上所面临的挑战和展望.
关 键 词: 卷积神经网络; 图像识别; 人体动作识别; 人脸识别
中图分类号: TP391 文献标识码: A 文 章 编 号: 1000-1220( 2021) 09-1980-05

Research Review on Image Recognition Based on Deep Learning

GAI Rong-li1 ,CAI Jian-rong 1 ,WANG Shi-yu2,3 ,CANG Yan1 ,CHEN Na1
1
( College of Information Engineering,Dalian University,Dalian 116622,China)
2
( University of Chinese Academy of Science,Beijing 100049,China)
3
( Shenyang Institute of Computing Technology,Chinese Academy of Sciences,Shenyang 110168,China)

Abstract: Before the advent of convolutional neural netw orks,image recognition methods mainly relied on artificially designed fea-
tures,and such features can only represent the low -level information in the image,and it is difficult to extract the deep-level informa-
tion of the image. A convolutional neural netw ork simulates the human brain to analyze,learn and interpret data by establishing a deep
neural netw ork. It has strong expression and generalization capabilities and can better represent the deep-level information of the im-
age. Research on image recognition based on convolutional neural netw orks can promote the development of the computer field. This
article first gives an overview of convolutional neural netw orks,focusing on the applications and advantages and disadvantages of con-
volutional neural netw ork-related algorithms in face recognition,human action recognition,medical image processing,and agricultural
pests and diseases recognition,and finally discusses convolutional neural netw orks. Challenges and prospects faced by the netw ork in
image recognition.
Key words: convolutional neural netw ork; image recognition; human action recognition; face recognition

图像识别准确率.
1 引 言 图 像 识 别 是 区 分 不 同 类 别 的 图 像,卷 积 神 经 网 络
( Convo-lutional Neural Netw ork,CNN ) 是完成图像识别任务
作为计算机视觉领域的一个重要分支,图像识别研究始 [4]
的最佳算法之一 ,设计卷积神经网络的目的就是模仿人类
于上个世纪 40 年代,
60 年代随着人工智能的出现而得到了
的学习模式,通过对输入样本的训练与测试,由简到深地提取
迅速发展. 在过去的几十年间,图像识别的应用领域已经覆盖
特征来区分样本. 神经网络可降低图像分类误差,得到高识别
了军事、安全、生物医学、农业、自动化等人类社会生活的许多
[1] 率. 文章从算法运用方面指出卷积神经网络在各领域图像识
方面. 传统的图像识别方法有: 反向传播算法 、贝叶斯分类
[2] 别中的优点和缺点,为今后更深一步研究提供参考.
法 等. 这些传统的识别方法主要提取像素级的低级特征且
需要人为进行预处理操作,影响了图像的识别精度. 人类视觉 2 卷积神经网络概述
的处理过程将对图像内容的理解转化为对低层特征的语义理
[4]
解, 并将其逐层映射到高层领域,深度学习很好地模拟了该过 卷积神经网络 是一种前馈多层网络,信息的流动只有
[3]
程 . 因此,利用深度学习方法进行图像识别将大大地提高 一个方向,即从输入到输出,每个层使用一组卷积核执行多个

收稿日期: 2021-01-25 收修改稿日期: 2021-03-28 基金项目: 大连市科技创新基金项目( 2020JJ27SN101 ) 资助. 作者简介: 盖荣丽,女,
1980 年生,博士,副教授,CCF 会员,研究方向为深度学习、人工智能等; 蔡建荣,男, 1993 年生,硕士研究生,CCF 会员,研究方向为深度学习、机
器视觉; 王诗宇,男, 1990 年生,博士研究生,研究方向为机器人技术、机器人视觉系统; 仓 艳,女, 1995 年生,硕士研究生,研究方向为人工智
能; 陈 娜,女, 1996 年生,硕士研究生,CCF 会员,研究方向为计算机视觉、深度学习.
9期 盖荣丽 等: 卷积神经网络在图像识别中的应用研究综述 1981

转换. CNN 模型主要包含卷积层、池化层、全连接层. 以 CNN 出了基于深度学习的人脸识别定位方法来使人脸关键点识别


[8]
模型为基础,将多层卷积和多层池化结合产生新的网络模型, 的应用性变强 .
可提高 网 络 结 构 的 准 确 度. 经 典 的 卷 积 神 经 网 络 模 型 有 传统的人脸识别方法主要分为基于统计、知识两大类,如
GoogLeNet、AlexNet、VGGNet 等[5] . 基于模版匹配等方法. 人脸识别大多采用视频进行检测,由于
利用 CNN 进行图像识别将图像直接输入到模型,不需要 人脸的表情、姿态、年龄、位置等引起的类内变化以及外界光
传统算法中的预处理和特征提取过程就可以保留图片本身的 背景等身份不同引起的类间变化从而影响视频检测人脸
照、
结构,
从而降低模型处理复杂度. 与其他神经网络的不同之处 的精度,因此基于视频的人脸识别仍然是一个重大的挑战. 为
在于,
CNN 中存在一层或多层中的矩阵乘法运算被替换成卷 了提高 人 脸 识 别 率,需 要 增 强 人 脸 特 征 对 这 些 因 素 的 鲁
[9]
积运算,其利用多层神经网络和图像局部性的优点减少了大量 棒性 .
[10]
参数,
提高模型训练速度. 最初 CNN 被广泛应用于目标识别任 采用聚合模型可以基于视频对人脸进行检测,Peng 等
务,
目前在目标跟踪、
姿态估计、文本检测与识别、视觉显著性 提出了基于几何特征的聚合方法,参考每个帧的重要性和帧
检测、
动作识别、
场景标记等任务中也表现出了出色的性能. 与帧在特征空间中的几何关系. 基于注意力的聚合网络在所
有帧中沿着每个特征维度自适应地对特征进行加权,能够自
适应地、细粒度地度量特征在所有帧中的重要性.
由于视频中存在图像模糊、表情姿态动态变化的情况,会
导致识别精度较低. 基于卷积神经网络改进的模型可以解决
[11]
这一问题. Zhao 提出了一种端到端的可训练级联网络 RD-
CFace,网络可以学习校正和对准参数,从而在不需要监控人
脸标志点和畸变参数的情况下获得更好的人脸识别性能.
在实际情况下,人脸数据集是高度不平衡的,类的样本数
[12]
量差异巨大,Liu 等人 提出了 M argin Softmax 损失来自适
[13]
应地调整不同类的 M argin. Liu 等提出了 Fair Loss,每个类
[6]
图1 卷积神经网络 LeNet-5 模型结构图 通过 深 度 Q 学 习 ( Deep Q-Learning ) 来 学 习 一 个 自 适 应 的
Fig. 1 M odel structure diagram of convolutional M argin. Li[14] 等人提出一种加权 E-M argin 损失用于获取具有
neural netw ork LeNet-5[6]
高区分度的人脸识别特征. 基于卷积神经网络的模型在人脸
识别领域的运用,可以极大地提高检测精度. 在人脸识别方向
CNN 的基本结构为特征提取层和特征映射层. 通过层间
的发展中,解决上述存在的问题,会更有利于进一步研究. 在
的感受野相连,提取局部特征. 特征映射结构主要是使用 Sig-
复杂背景中,人脸由于物体、人脸间的遮挡,使得识别难度增
moid 函数对卷积神经网络进行操作,保证其位移不变性. 卷
强,为提高背景复杂下人脸的识别度,在训练过程中,局部遮
积层是 CNN 中最基本的也是最重要的一层,基本上是对给定
挡人脸识别可以摆脱这一限制,何芳州等人提出了一种低秩
图像的像素矩阵进行卷积或乘法,以生成给定图像的激活映
稀疏与网络学习的人脸识别算法,使得遮挡噪声的敏感性降
射( activation map) ,连接一个计算层,该计算层求得局部平均 [15]
低,提高了复杂环境中人脸识别的可靠性和实时性 .
和二次提取特征,该操作减小了特征分辨率. 卷积神经网络
人脸识别是一种流行而有效的生物识别认证形式,可用
LeNet-5 的模型结构如图 1 所示.
于访问基于用户的系统. 但是人脸识别技术的一个缺点就是
3 在图像识别中的应用研究 伪装者可以通过向传感器展示有效的用户照片来访问系统,
使得人脸 识 别 系 统 面 临 着 各 种 类 型 的 人 脸 欺 骗 攻 击 ( face
基于卷积神经网络的图像识别技术由于提取特征能力 spoof attack) ,如打印攻击( print-attack) 、重放攻击( replay-at-
强、识别精度高以及实施性强等优点,在人脸识别、人体动作 3D 掩码攻击( 3D mask attack) [16] .
tack) 、
识别、医疗图像、农作物病虫害等方面运用广泛,从 2012 年提 3. 2 人体动作识别
出的 AlexNet 到 2014 年谷歌提出的 GoogleNet 图像分类错误 视频中人体动作识别就是在视频内容和行为类型之间建
率在数据集 ImageNet 上由 16. 4% 降到 6. 7% . 2015 年,微软 立对应关系. 传统的人体动作识别方法分为基于人体运动信
[7]
研究员提出 PReLU-Nets 模型在 ImageNet 数据集上使得图 息的特 征 提 取 方 法
[17]
和基于时空兴趣点的特征提取方
[18,
19]
像分类错误率降为 4. 94% ,该模型成为第一次人脸识别错误 法 两大类. 特征提取过程划分为特征提取与后续动作识
率较低的模型. 以下列举了卷积神经网络在人脸识别、人体动 别两个阶段. 深度学习端到端的训练方法可以对特征提取与
作识别、医疗图像处理、农业病虫害识别等领域的应用. 后续的分类识别进行统一训练与学习.
[20]
3. 1 人脸识别 原始视频存在冗余信息,Yang 等提出了一种时空注意
人脸识别( Face Recognition,FR) 技术利用计算机学习通 力卷积神经网络 ( STA-CNN ) ,能够自动选择有区别的时间
过人脸特征来提取个人信息,由于稳定性好从而逐渐运用到 段、
聚焦到信息空间区域,将时间注意力机制和空间注意力机
监控系统、智能支付、公安系统等应用中. 制结合到卷积网络对视频动作识别.
人脸检测自动检测人眼、鼻子等部位的轮廓点等人脸特 CNN 善于捕获局部特征,处理长时依赖问题效果不佳,
征点,从而实现人脸关键点的高精度识别和定位,许佳等人提 而 RNN 尤其是 LSTM 在处理长时依赖问题时表现出巨大的
1982 小 型 微 型 计 算 机 系 统 2021 年

[21]
优势,Zhao 等 将改进的注意力 CNN 和 RNN 相结合来解 M ohamed 等[28] 构 建 CNN 模 型,在 大 型 数 据 集 上 区 分
决动作识别任务. “散射密度”和“异质密度”两种类型的乳腺密度. 为评估分类
动作识别任务普遍出现在视频检测中,设计一种轻量级 性能,在乳房 X 光图像数据集上,去除可能分类不正确的图
[22]
网络进行视频动作识别降低时空信息的建模能力,Li 等 结 实验表明该模型在两种乳腺密度类别方面具有非常优异
像,
合时间卷积与空间卷积提出一种时空协同卷积模型 ( STC- 分类性能. 表 1 列举了一些深度学习在医疗上的应用.
Conv) 来降低模型复杂度、提高计算效率. 实验结果表明该模 利用最前沿的技术对医疗图像进行分析研究有着重要的
型的性能优于 3D-CNNs、计算成本甚至比 2D-CNNs 还低. 研究价值,可以帮助医生快速地做出诊断.
Roig[23] 等针对缺少对行为相关的上下文信息的检测和 3. 4 农业病虫害识别
理解能力,为此提出基于动作、场景、物体和声音特征的多模 病虫害是农业领域面临的最大的挑战,传统病虫害检测
态系统和金字塔结构分层特征组合方法. 实验表明多模态特 方法依靠农民的经验或者专家指导. 由于农作物类型复杂、生
征有效地提高人体动作识别能力. 长阶段不均等因素导致农作物图像特征提取困难,检测率低
近年来,人体动作识别取得了相当大的进展,但是由于遮 下. 随着卷积神经网络的发展,目前科研工作者已经将其广泛
挡、摄像机移动、光照变化、背景的复杂多样、受试者动作类似 运用于病虫害识别检测、植物和农作物的识别、杂草的检测与
等原因,要准确地识别视频序列中的动作仍然具有挑战性. 分类等多项研究.
3. 3 医疗图像处理 针对水稻的主要害虫褐飞虱体积小、数量多,难以检测的
[41]
医学图像种类繁多、分辨率低、人体结构复杂,在一定程 问题,He 等 提出一种两层均为 Faster RCNN 的检测算法,
度上限制了医生对患者做出有效诊断. 当前临床影像诊断主 两层采用不同的特征提取网络,将该两层检测算法的检测结
要是人工阅片,但效率低下,且肉眼阅片方法存在较高的假阳 果与用 YOLOv3 的检测结果进行比较,发现前者的平均召回
性结果. 卷积神经网络模型是医学影像中预测早起疾病症状 率要比后者高 24. 8% ,对于不同的年龄段的褐飞虱,两层检
的重要方式,通过有监督与无监督的算法对一些特定标准的 测算法的平均召回率要比 YOLO-v3 高 38% ,实验结果表明
数据集进行预测,其在医学领域发挥的作用日益突出. 该方法具有一定的有效性. 因为 AlexNet 模型参数多、特征尺
[42]
采用医学图像分割识别感兴趣区域( ROI) 内部或轮廓的 度单一,Zhang 等 提 出 一 种 将 扩 张 卷 积 ( dilated convolu-
tion) 与全局池化( global pooling) 相结合的全局池化扩张卷积
像素或像素集,是对人体器官的医学图像进行精准有效地分
[24]
割时实现疾病诊断的关键步骤. Tang 等人提出一种在自动 神经网络( GPDCNN) 用于黄瓜病虫害识别,该模型相比 CNN
和 AlexNet,在计算复杂度没有增加的情况下,通过用全局池
上下文方案中使用多阶段 UNet( M S-Unet) 的框架来精确地
[25] 化层代替全连接层增加了卷积感受野且不丢失判别式. Bollis
端到端分割皮肤损伤. 焦庆磊等 提出 LSFNet 模型来实现 [43]
等 设计了一个在显著性映射指导下的弱监督学习过程来
肺结节的检测,在分类时融合位置和尺寸信息过程中实现对
自动选择图像中的 ROI,这样大大地减少标注任务,并将其用
输入图片进行肺部实例分割.
于柑橘作物病虫害识别中,因缺少数据,创建了一个 CPB 数
Zhou 等[26] 提出一种基于 CNN 的医学运动图像智能识 [44]
据集,在两大数据集 IP102 和 CPB 上实验取得了不错的效
别算法. 极值学习机引用到 CNN 中,将融合后的特征训练为 [45]
果. Turkoglu 等 将 LSTM 与预训练的 CNN 模型进行组合
CNN 的输入信息. 该算法的人工特征与深度学习特征互补,
形成 M LP-CNNs 用于植物病虫害检测. 在迁移学习过程中用
从不同的角度描述了医学图像的人体运动信息.
AlexNet、GoogleNet、DenseNet201 模型进行特征提取,后将这
表1 深度学习在医疗图像中的部分研究应用 些特征输入到 LSTM 层,构建鲁棒的苹果病虫害检测杂交模
Table 1 Some research applications of 型,实验结果相当于或优于预训练的模型.
deep learning in medical images 卷积神经网络模型的快速发展使得农作物病虫害识别取
文献 采用模型 研究问题 得了一定成绩. 由于实际农田中摄像机的稀疏性,所获取的图
Nigri 等[29] DCNN 阿尔茨海默病 MRI 诊断 像往往模糊不清,且现有技术主要基于清晰、高分辨率的图像
Xu 等[30] SSAE 乳腺癌图像细胞核检测 数据集上训练的,对于低分辨率图像的识别效果不佳. 农作物
Zheng 等[31] CNN 肺结节检测
病虫害种类多,每种病虫害对应的数据集比较少,因为需要为
Bansal 等[32] Deep3DSCan 肺癌分割与分类
每种病虫害建立一定数量、一定规模的病虫害图像数据集.
Zhang 等[33] HBNet 胃肿瘤自动分割
Imran 等[34] SOM -RBF 白内障早期诊断与分类
4 总结与展望
Yuan 等[35] DCNN 皮肤损伤分割
Zhang 等[36] Mask R-CNN 脑出血识别 卷积神经网络在计算机视觉方面的应用,包括图像的分
Yu[37] ResNet 皮肤黑色素瘤识别
类识别、视频识别等都有着明显的优势,在语音识别方面也取
Mashrur[38] AlexNet 心率失常自动识别
得了突破性的进展,但是图像识别在实际运用中仍然存在一
Lu[39] ECNN 甲状腺分割
Liu[40] CNN-BN-PReLU 脑图像识别
些挑战,值得研究者进一步探讨研究与解决.
1) 图像是识别的基础数据,图像识别中首要的挑战就是
Hu 等[27] 提出一种多核深度卷积 ( M D-Conv ) 模型用于 模糊图像、受环境影响的图像( 如受光线、噪声影响) 、遮挡的
胸部 X 线图像疾病自动诊断,能够利用多尺度核函数学习多 图像等情况. 虽然前人提出了各种各样的技术来尽可能地减
尺度特征,运用于医学图像自动诊. 少这种挑战,但是这些问题依然存在于计算机视觉任务中.
9期 盖荣丽 等: 卷积神经网络在图像识别中的应用研究综述 1983

2) 卷积神经网络在检测中需要对数据进行标注,一个模 od based on curvelet transform and cosine measure[J]. Computer


型的训练过程中往往需要大量手工标注的数据,随着大规模 Science, 43( 5) : 294-297.
2016,

数据量的涌现,无标签的未知数据占绝大多数,为这些数据做 [10] Peng B,Jin X,Wu Y,et al. Geometry guided feature aggregation in
video face recognition[C]/ / IEEE / CVF International Conference
标签已经变得不够现实了,而且找专家来标注数据是非常昂
on Computer Vision Workshop( ICCVW ) ,Seoul,Korea( South) ,
贵的. 这个时候我们就要学会从无标注的数据里面进行学习,
2019: 2670-2677.
现有的研究方法包括生成对抗网络、主动学习( Active Learn-
[46]
[11] Zhao H,Ying X,Shi Y,et al. RDCFace: radial distortion correction
ing) 等.
for face recognition[C]/ / IEEE / CVF Conference on Computer Vi-
3) 非欧空间数据不存在平移不变性,采用图卷积神经网
sion and Pattern Recognition ( CVPR) ,Seattle,WA,USA,2020:
络可以处理图数据. 在该领域中,目前存在的主要方法为谱方 7718-7727.
法和空间方法,研究表明,虽然图卷积神经网络取得了一定的 [12] Liu H,Zhu X,Lei Z,et al. AdaptiveFace: adaptive margin and sam-
[47]
成果,但仍然有很多问题需要解决 . pling for face recognition[C]/ / IEEE / CVF Conference on Com-
4) 目前在深度学习中训练网络模型需要大量的数据样 puter Vision and Pattern Recognition ( CVPR) ,Long Beach,CA,
如何在少量样本情况下即保证识别精度又能大大提高网
本, USA,
2019: 11939-11948.
络的训练速度是很多研究者的一个重要目标. 数据扩充( Data [13]Liu B,et al. Fair loss: margin-aw are reinforcement learning for deep
Augmentation) 是一项非常重要的技术,其可以从现有的数据 face recognition [C]/ / IEEE / CVF International Conference on

中产生更多的有用数据. 神经网络中 Dropout 的引入使得样 Computer Vision ( ICCV ) ,Seoul,Korea ( South ) ,2019,100:
51-10060.
本不足的条件下也能够比较高的识别率,文献[48]提出采用
[49] [14] Li Q,He X,Wang W,et al. AeMFace: additive E-margin loss for
滑动窗口技术增加训练数据的方法. Chen 等人 提出了一
deep face recognition[C]/ / IEEE International Conference on Sig-
种 GridM ask 的数据扩增策略,该策略删除均匀分布的区域,
nal,Information and Data Processing ( ICSIDP) ,Chongqing,Chi-
最后形成网络形状,使用此形状删除信息比设置完全随机位
2019: 1-6.
na,
置更加有效.
[15]He Fang-zhou,Li Xin. Research on occluded face recognition based
总之,CNN 目前还存在很多待解决的问题,这些问题不 on low rank sparse and netw ork learning[J]. Computer Simula-
影响在各领域中图像识别的运用和发展. 仍然是研究的一大 tion, 37( 10) : 14-17 + 96.
2020,
热点. [16] Patel K,Han H,Jain A K. Secure face unlock: spoof detection on
smartphones[J]. IEEE Transactions on Information Forensics and
References:
Security, 11( 10) : 2268-2283.
2016,
[1] Kim H,Nam K. Object recognition of one-DOF tools by a back-
[17] Hai-Hong P,Ngoc-Son V,Vu-Lam N,et al. Action recognition
propagation neural net[J]. IEEE Transactions on Neural Netw ork,
based on motion of oriented magnitude patterns and feature selec-
6( 2) : 484-487.
1995,
tion[J]. IET Computer Vision, 12( 5) : 735-743.
2018,
[2] Wong Shu-fai,Cipolla R. Continuous gesture recognition using a
[18] Song S,Lan C,Xing J,et al. Spatio-temporal attention-based
sparse Bayesian classifier[C]/ /18th International Conference on
LSTM netw orks for 3D action recognition and detection[J]. IEEE
Pattern Recognition ( ICPR' 06 ) ,Hong Kong,China,2006: 1084-
Transactions on Image Processing, 27( 7) : 3459-3471.
2018,
1087,doi: 10. 11 09 / ICPR. 2006. 411.
[19]Hu X,Huang Y,Duan Q,et al. Abnormal event detection in crow d-
[3] Xu Wen. Research and application of image recognition algorithm
ed scenes using histogram of oriented contextual gradient descriptor
based on deep learning[D]. Nanjing: Nanjing University of Finance
and Economics,
2017. [J]. EURASIP Journal on Advances in Signal Processing,
2018,
54

[4] Hu H,Yang Y. A combined GLQP,and DBN-DRF for face recog- ( 2018) : 1-15.

nition in unconstrained environments[C]/ /2nd International Con- [20] Yang H,Yuan C,Zhang L,et al. STA-CNN: convolutional spatial-

ference on Control,Automation and Artificial Intelligence ( CAAI temporal attention learning for action recognition[J]. IEEE Trans-
2017) ,
2017. actions on Image Processing,2020,29 ( 99 ) : 5783-5793,doi: 10.
[5] Zheng Yuan-pan,Li Guang-yang,Li Ye. A review on the applica- 110 9 / TIP. 2020. 2984904.
tion of deep learning in image recognition [J]. Computer Engineer- [21] Zhao H,Jin X. Human action recognition based on improved fusion
ing and Applications, 55( 12) : 20-36.
2019, attention CNN and RNN[C]/ /5th International Conference on
[6] LeCun Y,Bottou L,Bengio Y,et al. Gradient-based learning ap- Computational Intelligence and Applications ( ICCIA ) ,Beijing,
plied to document recognition[J]. Proceedings of the IEEE,
1998, 2020: 108-112.
86( 11) : 2278-2324. [22] Li X,Wen L,Wang J,et al. Spatiotemporal collaborative convolu-
[7] He K,Zhang X,Ren S,et al. Delving deep into rectifiers: surpass- tion for video action recognition[C]/ / IEEE International Confer-
ing human-level performance on ImageNet classification[C]/ / ence on Artificial Intelligence and Computer Application ( ICAI-
IEEE International Conference on Computer Vision ( ICCV ) ,San- CA) ,Dalian,
2020: 554-558.
tiago,Chile,
2015: 1026-1034. [23] Roig C,Sarmiento M ,Varas D,et al. Multi-moda pyramid feature
[8] Xu Jia,Tian Wei-jian,Fan Yang-yu. Simulation of face key point combination for human action recognition[C]/ / IEEE / CVF Inter-
recognition and location method based on deep learning[J]. Com- national Conference on Computer Vision Workshop( CCVW) ,Se-
puter Simulation, 37( 6) : 434-438.
2020, oul,Korea( South) ,
2019: 3742-3746.
[9] Li Yan-ping,Jiang Ying,Hu Jin-ming,et al. Face recognition meth- [24] Tang Y,Yang F,Yuan S,et al. A multi-stage framew ork w ith con-
1984 小 型 微 型 计 算 机 系 统 2021 年

text information fusion structure for skin lesion segmentation[C]/ / Healthcare Informatics( ICHI) ,New York,NY,
2018: 191-198.
IEEE 16th International Symposium on Biomedical Imaging ( IS- [40]Liu Y,
Xiong J. Brain image recognition algorithm and high-perform-
BI) ,Venice,Italy,
2019: 1407-1410. ance computing of internet of medical things based on convolutional
[25] Jiao Qing-lei,Chen Yu-tong,Zhu Ming. Chest X-ray pulmonary neural network[J]. IEEE Access, 7( 99) : 108633-108646.
2019,
nodule detection based on location and scale information[J]. Jour- [41] He Y,Zhou Z,Tian L,et al. Brow n rice planthopper( Nilaparvata
40( 6) : 1324-1329.
2019,
nal of Chinese Computer Systems, lugens Stal) detection based on deep learning [J]. Precision Agri-
[26] Zhou Y,Gao Z. Intelligent recognition of medical motion image culture, 21( 6) : 1385-1402.
2020,
combining convolutional neural netw ork w ith internet of things [42] A S Z,BS Z,C C Z,et al. Cucumber leaf disease identification
[J]. IEEE Access, 7( 99) : 145462-145476.
2019, w ith global pooling dilated convolutional neural netw ork[J]. Com-
[27] Hu M ,Lin H,Fan Z,et al. Learning to recognize chest-Xray images puters and Electronics in Agriculture,2019,
162: 422-430,doi: 10.
faster and more efficiently based on multi-kernel depthw ise convo- 1016 / j. compag. 2019. 03. 012.
lution[J]. IEEE Access, 8( 99) : 37265-37274.
2020, [43] Bollis E,Pedrini H,Avila S. Weakly supervised learning guided by
[28] Mohamed A A,Berg W A,Peng H,et al. A deep learning method activation mapping applied to a novel citrus pest benchmark[C]/ /
for classifying mammographic breast density categories[J]. Medi- IEEE / CVF Conference on Computer Vision and Pattern Recogni-
cal Physics, 45( 1) : 314-321.
2018, tion Workshops( CVPRW) ,Seattle,WA,USA,
2020: 310-319.
[29] Nigri E,Ziviani N,Cappabianco F,et al. Explainable deep CNNs [44] Wu X,Zhan C,Lai Y,et al. IP102: a large-scale benchmark dataset
for MRI-based diagnosis of Alzheimer's disease [C]/ / Internation- for insect pest recognition[C]/ / IEEE / CVF Conference on Com-
al Joint Conference on Neural Netw orks( IJCNN) ,Glasgow ,United puter Vision and Pattern Recognition ( CVPR) ,Long Beach,CA,
2020: 1-8.
Kingdom, USA,
2019: 8779-8788.
[30] Xu J,et al. Stacked sparse sutoencoder( SSAE) for nuclei detection [45] Turkoglu M ,Hanbay D,Sengur A,et al. Multi-model LSTM -based
on breast cancer histopathology images [C]/ / IEEE Transactions convolutional neural netw orks for detection of apple diseases and
on Medical Imaging, 35( 1) : 119-130.
2016, pests[J]. Journal of Ambient Intelligence and Humanized Compu-
[31] Zheng S,Guo J,Cui X,et al. Automatic pulmonary nodule detec- 2019: 1-11,doi: 10. 1007 / s12652-019-01591-w .
ting,
tion in CT scans using convolutional neural netw orks based on [46] Song Han,Yang Wei-tun,Geng Xiu-rui,et al. Hyperspectral image
maximum intensity projection[J]. IEEE Transaction on Medical classification based on convolutional neural network and active
2020,
Imaging, 39( 3) : 797-805. learning[J]. Journal of University of Chinese Academy of Sciences,
[32] Bansal G,Chamola V,Narang P,et al. Deep3DCan: deep residual 37( 2) : 169-176,
2020, doi: 10. 7523 / j. issn. 2095-6134. 2020. 02. 004.
netw ork and morphological descriptor based framew ork for lung [47] Xu Bing-bing,Cen Ke-ting,Huang Jun-jie,et al. A survey graph
cancer classification and 3D segmentation[J]. IEt Image Process- convolutional neural netw ork[J]. Chinese Journal of Computers,
ing, 14( 7) : 1240-1247.
2020, 43( 5) : 755-780.
2020,
[33] Zhang Y,et al. HBNet: hybrid blocks netw ork for segmentation of [48] Kang Y,Wang Y,Cheng G,et al. Classification of microseismic e-
gastric tumor from ordinary CT images [C] / / IEEE 17th Interna- vents and blasts using deep belief netw ork[C]/ / Chinese Control
tional Symposium on Biomedical Imaging ( ISBI) ,Iow a City,IA, And Decision Conference( CCDC) ,Hefei,
2020: 5556-5561.
USA,
2020: 1-4. [49] Chen P,Liu S,Zhao H,et al. GridMask data augmentation [J].
[34]Imran A,Li J,Pei Y,et al. Cataract detection and grading w ith reti- arXiv preprint arXiv: 2001. 04086,
2020.
nal images using SOM -RBF neural netw ork[C] / / IEEE Symposi-
um Series on Computational Intelligence ( SSCI) ,Xiamen,2019: 附中文参考文献:
2626-2632,doi: 10. 1109 / SSCI448 17. 2019. 9002864. [3] 徐 文. 基于深度学习的图像识别算法研究和应用[D]. 南京:
[35] Yuan Y,Chao M ,Lo Y. Automatic skin lesion segmentation using 南京财经大学,
2017.
deep fully convolutional netw orks w ith jaccard distance[J]. IEEE [5] 郑远攀,李广阳,李 晔. 深度学习在图像识别中的应用研究综
Transactions on Medical Imaging, 36( 9) : 1876-1886.
2017, 述[J]. 计算机工程与应用, 55( 12) : 20-36.
2019,
[36] Hsu W. Automatic left ventricle recognition,segmentation and [8] 许 佳,田维坚,樊养余. 基于深度学习的人脸关键点识别定位
tracking in cardiac ultrasound image sequences[J]. IEEE Access, 方法仿真[J]. 计算机仿真, 37( 6) : 434-438.
2020,
2019,
7: 140524-140533,doi: 10. 1109 / ACCESS. 2019. 2920957. [9] 李艳萍,姜 颖,胡金明,等. 基于曲波变换和余弦测度的人脸识
[37] Yu Z,Jiang X,Zhou F,et al. Melanoma recognition in dermoscopy 别方法[J]. 计算机科学, 43( 5) : 294-297.
2016,
images via aggregated deep convolutional features[J]. IEEE Trans- [15] 何芳州,李 鑫. 基于低秩稀疏与网络学习的遮挡人脸识别研究
actions on Biomedical Engineering, 66( 4) : 1006-1016.
2019, [J]. 计算机仿真, 37( 10) : 14-17 + 96.
2020,
[38] Mashrur F R,
Dutta Roy A,
Saha D K. Automatic identification of ar- [25] 焦庆磊,陈宇彤,朱 明. 融合位置尺度信息的胸部 X 光肺结节
rhythmia from ECG using AlexNet convolutional neural network 检测[J]. 小型微型计算机系统, 40( 6) : 1324-1329.
2019,
[C]/ /4th International Conference on Electrical Information and [46] 宋 晗,杨炜暾,耿修瑞,等. 基于卷积神经网络与主动学习的高
Communication Technology,
Khulna,
Bangladesh,
2019: 1-5. 光谱图像分类[J]. 中国科学院大学报,2020,37 ( 2 ) : 169-176,
[39] Lu H,Wang H,Zhang Q,et al. A dual-tree complex w avelet trans- doi: 10. 7523 / j. issn. 2095-6134. 2020. 02. 004.
form based convolutional neural netw ork for human thyroid medi- [47] 徐冰冰,岑科廷,黄俊杰,等. 图卷积神经网络综述[J]. 计算机
cal image segmentation[C]/ / IEEE International Conference on 学报, 43( 5) : 755-780.
2020,

You might also like