You are on page 1of 10

云南大学学报(自然科学版)

Journal of Yunnan University(Natural Sciences Edition)


ISSN 0258-7971,CN 53-1045/N

《云南大学学报(自然科学版)》网络首发论文

题目: 基于多尺度密集连接网络的矿物图像智能识别
作者: 杨彪,马亦骥,倪瑞璞,苏森涛,曾德明
收稿日期: 2022-02-03
网络首发日期: 2022-05-16
引用格式: 杨彪,马亦骥,倪瑞璞,苏森涛,曾德明.基于多尺度密集连接网络的矿物
图像智能识别[J/OL].云南大学学报(自然科学版).
https://kns.cnki.net/kcms/detail/53.1045.N.20220513.1359.002.html

网络首发:在编辑部工作流程中,稿件从录用到出版要经历录用定稿、排版定稿、整期汇编定稿等阶
段。录用定稿指内容已经确定,且通过同行评议、主编终审同意刊用的稿件。排版定稿指录用定稿按照期
刊特定版式(包括网络呈现版式)排版后的稿件,可暂不确定出版年、卷、期和页码。整期汇编定稿指出
版年、卷、期、页码均已确定的印刷或数字出版的整期汇编稿件。录用定稿网络首发稿件内容必须符合《出
版管理条例》和《期刊出版管理规定》的有关规定;学术研究成果具有创新性、科学性和先进性,符合编
辑部对刊文的录用要求,不存在学术不端行为及其他侵权行为;稿件内容应基本符合国家有关书刊编辑、
出版的技术标准,正确使用和统一规范语言文字、符号、数字、外文字母、法定计量单位及地图标注等。
为确保录用定稿网络首发的严肃性,录用定稿一经发布,不得修改论文题目、作者、机构名称和学术内容,
只可基于编辑规范进行少量文字的修改。
出版确认:纸质期刊编辑部通过与《中国学术期刊(光盘版)》电子杂志社有限公司签约,在《中国
学术期刊(网络版)》出版传播平台上创办与纸质期刊内容一致的网络版,以单篇或整期出版形式,在印刷
出版之前刊发论文的录用定稿、排版定稿、整期汇编定稿。因为《中国学术期刊(网络版)》是国家新闻出
版广电总局批准的网络连续型出版物(ISSN 2096-4188,CN 11-6037/Z),所以签约期刊的网络版上网络首
发论文视为正式出版。
网络首发时间:2022-05-16 09:01:06
网络首发地址:https://kns.cnki.net/kcms/detail/53.1045.N.20220513.1359.002.html

云 南 大 学 学 报 ( 自 然 科 学 版 ) , 2022, 44 DOI: 10.7540/j.ynu.20220032


Journal of Yunnan University: Natural Sciences Edition

基于多尺度密集连接网络的矿物图像智能识别

杨 彪1,2,3**,马亦骥1,2,倪瑞璞1,2,苏森涛1,2,曾德明1,2
(1. 昆明理工大学 信息工程与自动化学院,云南 昆明 650500;2. 昆明理工大学 云南省人工智能重点实验室,
云南 昆明 650500;3. 昆明理工大学 非常规冶金教育部重点实验室,云南 昆明 650093)

摘要:针对判定矿物种属的传统网络由于计算复杂度高及网络参数量大而导致其应用部署所需环境资源
要 求 高 的 问 题 , 提 出 了 一 种 基 于 多 尺 度 密 集 连 接 的 网 络 模 型 ( Multi-Scale Densely connected convolutional
Network, MS-DenseNet)用于矿物的智能识别. 首先为了使网络具有多尺度特征学习能力,在密集连接网络中
引入多尺度卷积结构;其次,采用分组卷积策略优化网络结构,最后在网络尾部采用跳跃连接结构以减少特
征信息损失. 在自建矿物数据集上的实验结果显示,网络模型的验证集和测试集准确率分别达到 90.54% 和
88.06%,表明该网络模型具有良好的识别能力. 该方法在矿物识别领域中具有潜在应用价值.
关键词: 矿物图像;多尺度密集连接;分组卷积;智能识别;网络模型
中图分类号:TP391.7 文献标志码:A 文章编号:0258−7971(2022)00−0001−09

在矿物的勘探过程中,快速、准确对矿产资源 岩心断层图像进行分割,比较了各个方法的优劣性
进行识别,判明其品质和储量,决定开采规模具有 找到了适用于矿物图像分割的机器学习算法;受此
重大意义 [1-2]. 矿物肉眼鉴定是地质研究者所必须 启 发 Baklanova 等 [7] 使 用 K-means 聚 类 算 法 对 显
熟练掌握的基本技能,因为肉眼鉴别可以初步估计 微镜下拍摄的矿物图像定性评估其组成成分. 贺金
出矿物的种或族,由此决定选用什么方法进行精确 鑫等 [8] 使用朴素贝叶斯分类模型对高光谱矿物图
的鉴定和研究. 但这种方法受限于鉴别者主观经验, 像进行识别. 但这些方法分析既耗时准确率又不
鉴别准确性不高 [3],如果选用方法不当,也会对后 高. 之后刘钰先等[9] 针对岩石薄片成分分析耗时且
续研究会造成困难. 准确率不高问题,提出基于协同表示的多特征融合
随着机器学习技术的发展,采用模型判定矿物 岩石分类法,识别速度得到了极大的提升,但仍未
种属的方法逐渐成为多数学者采用的方法.Baykan 解决需要人工筛矿物特征这一问题. 近十年来,围
等 [4] 采用人工神经网络(Artificial Neural Network, 绕着计算机视觉技术开展的研究工作取得了傲人
ANN)对 5 种显微镜下薄片图像进行分类,证明了 的成绩,尤其是卷积神经网络解决了传统机器学习
RGB 这一颜色空间是矿物识别最佳色彩空间,但 需要人工筛选特征问题,许多学者开始采用此技术
由于不同族的矿物其颜色特征可能相似,所以此方 解决矿物识别的问题. 程国建等 [10] 通过搭建浅层
法还不能作为判别矿物种属的依据. 与此同时, 卷积神经网络,对 3 类岩石薄片进行自动分类取得
Singh 等[5] 采用多层感知机(Multi-Layer Perceptron, 了 98% 准确率;白林等 [11] 基于 VGG19 网络,对 6
MLP)进行岩石纹理识别,通过从不同玄武岩提取 种常见岩石薄片进行分类取得了 82% 准确率;郭
的数值参数作为输入,以岩体纹理类别作为输出, 艳军等 [12] 以 ResNet 作为框架,对 5 种偏光显微镜
相比单一颜色特征作为区分不同种矿物,此方法准 下矿物进行鉴别取得了 89% 的准确率;徐述腾等[13]
确率较高,但需要人工从众多矿岩数值中进行筛选 基于 U-net 网络对 5 种硫化矿物的显微镜下图像
计算预处理过程较为繁琐,不利于实际工程应用. 进行识别,取得了 90% 的准确率. 采用卷积神经网
之后 S Chauhan 等 [6] 通过使用 7 种机器学习方法对 络彻底解决了人工筛选矿物特征的问题,但是早期

收稿日期:2022-02-03; 接受日期:2022-03-26;
基金项目:国家自然科学基金(61863020).
** 通信作者:杨 彪(1974−),男,云南人,博士,教授,主要研究多物理场耦合软测量及数值计算. E-mail:ybiaocn@163.com.
2 云南大学学报(自然科学版) http://www.yndxxb.ynu.edu.cn 第 44 卷

卷积神经网络所需训练数据较为庞大,同时对计算
机运算能力也有一定要求,而且目前针对实验环境
下矿物识别研究较多,而针对野外环境下矿物识别
过程研究较少. 之后也有学者针对这些问题进行了
优化和研究,如张野等 [14] 运用迁移学习的方法对
3 类矿岩图像进行分类取,得了 85% 准确率,运用
迁移学习方法可以很好弥补由于数据集不足造成
卷积神经网络欠拟合问题,但在迁移学习之前网络
仍需在样本充足的数据集上进行充分训练,该数据
集与矿物关联性的强弱会影响着最终的识别准确
率. 彭伟航等 [15] 通过改进 InceptionV3 网络和损失
图 1 密集连接结构示意图
函数,对 16 种矿物直接图像进行识别取得了 86% Fig. 1 Schematic diagram of dense connection structure
准确率. 采用 Inception 结构对矿物图像进行多尺
度采样可以充分提取到矿物特征,但由于传统 1.2 多尺度特征提取结构 由于 DenseNet 所有下
Inception 结构每一层都是特别设计的并且伴随着 层的网络层与上层输出的有一定关联,上层网络提
较大的参数量造成部署较为困难,而且采集到多尺 取到信息量多少对后续网络层有着一定影响. 而在
度特征信息并不能充分利用使得网络性能并不能 卷积神经网络中,浅层网络提取的特征和输入比较
充分发挥. 李明超等 [16] 利用模型集成的方法,通过 接近,如果只使用小卷积将会忽视掉一些全局信息,
耦合颜色和纹理特征的方法,对 19 类矿物图像实 造成后续可用于分类的信息较少,所以要让靠前的
现自动辨别,但计算复杂度仍然较高. 网络层具有不同尺度的特征获取能力. 此外,对于
针对上述问题,本文以直接获取的矿物图像作 非公共数据集而言样本数少是其显著特点,而采用
为研究对象,选用兼具低参数量和特征复用功能 多尺度卷积结构在一定程度可以弥补这一不足. 因
的 DenseNet[17] 为主干网络,同时结合前人所提聚 此 , 本 文 在 DenseNet 基 础 上 引 入 了 Inception[18]
合变换 [18] 思想,设计了一种多尺度密集连接网络 结构,如图 2 所示,并对传统 Inception 结构进行了
( Multi-Scale Densely connected convolutional Net- 参数优化,解除传统 Inception 结构存在针对性设
work, MS-DenseNet)作为矿物识别模型,并以分组 计、参数量大等不足.
卷积策略对多尺度结构进行参数优化减少参数量.
通过与典型网络在测试集上进行横向对比,实验结
果表明本文所提网络在参数量和准确率都有较大
优势.

1 面向矿物识别的智能算法
1.1 密集连接结构 密集连接网络(DenseNet)是
Huang 等[17] 于 2017 年提出一种网络模型. 相比之前
从深度和宽度角度提升网络性能,DenseNet 采用特
征复用的方式对网络性能进行提升. 通过将上层特征
提取器与下层特征提取器进行特征信息交互,将各自 图 2 传统 Inception 结构
Fig. 2 The structure of classic Inception
提取到的特征在通道维度进行拼接,丰富下层网络输
入特征的多样性的同时减少信息损失. 密集连接方式 首先,为了降低传统结构的计算复杂度同时又
让特征信息和梯度信息传递更加高效,对特征信息的 不损失其特征获取能力,采用大小为 1×1 的分组卷
挖掘更加充分,非常适用于样本数较少的数据集. 故 积对特征通道进行减半压缩,一方面可以起到线性
本文选取 DenseNet 中的密集连接结构作为矿物识 修正的作用,方便后续特征融合;另一方面,防止参
别的主干结构,密集连接结构如图 1 所示. 数量过大造成过拟合.
第 44 卷 杨 彪等:基于多尺度密集连接网络的矿物图像智能识别 3

采用分组卷积,可以以较少的参数获得与传统
卷积运算得到一样的特征图. 采用传统卷积其参数
量计算公式为:
p = k 2 c1 c2 , (1)
其中, p为参数量, k 为卷结核大小, c1为输入特征图
维度,c2为输出特征图维度.
而采用分卷卷积其参数量计算公式为:
1( 2 )
p= k c1 c2 , (2)
g
其中,g为分组数.
由公式(1)和(2)可知,传统卷积参数量是分组卷
积的 g 倍. 使用分组卷积消耗的计算内存更少,计算 图 3 优化后的 Inception 结构
复杂度也将降低,会使网络的推理速度得到加强. Fig. 3 The structure of improved Inception
然后,将分组卷积接入 3 分支结构. 分支 1 是一 其 中 , finput 为 输 入 特 征 , c 为 融 合 后 的 特 征 , wi (i =
组 3×3 卷积;分支 2 是两组 3×3 卷积,用两组 3×3 卷 1, 2, 3, 4)为特征权重值, gConv1×1为 1×1 分组卷积,
积替代一组 5×5 大尺度卷积;分支 3 是直连结构. 同 Conv3×3 为 3×3 卷积,Conv1×1 为 1×1 普通卷积,max()
时,引入一条最大池化分支,对上层特征图进行局部 为区域最大值函数.
特征提取,并将该分支与 3 卷积分支在通道维度进行 1.3 跳跃结构 输入网络经过多次下采样操作后,
拼接,构成一个多尺度特征提取模块. 虽然压缩了特征图的尺寸便于了后续分类,但是在
不同的卷积核所提取到的特征存在差异,其中 压缩过程中造成一些信息的丢失. 对于浅层网络层
大尺寸卷积核有助于捕获全局信息,同一点所包含 来说因为靠近输入图像层,这种影响非常小. 而对
语义信息也较为丰富;小尺寸卷积核有助于获取细 于深层的网络层这种影响是较为严重,可能会影响
节信息,最大池化层则更加关注特征图的局部信 最终分类效果. 所以为了减少这一损失,本文在密
息. 将不同分支获得的信息进行融合,根据各自所 集连接模块后的网络层引入跳跃结构,以减小特征
得权重自适应地处理特征信息. 使网络无需构建较 信息损失.
深的情况下,也能得到丰富的特征信息,这些信息 1.4 总体结构 本文网络结构如图 4 所示,表 1 给
增强了网络的鲁棒性提升了网络性能,改进后的多 出了每个网络层的具体信息.
尺度特征提取结构如图 3 所示.
MS-DenseNet 运算步骤如下:
融合后的特征计算公式为:
输出 矿物所属类别.
c = [w1 , w2 , w3 , w4 ] ·
 Conv (Conv (gConv ( f  步骤 1 读入图像,使用 7×7 卷积对原始图像
 3×3 3×3 1×1 input )))

 Conv3×3 (gConv1×1 ( finput ))  进行特征预提取并使用批标准化层进行归一化处
  , (3)
 Conv1×1 (max( finput ))  理,使用 ReLU 激活函数进行激活,使用最大池化

gConv1×1 ( finput ) 层将特征图压缩.

图 4 MS-DenseNet 结构示意图
Fig. 4 MS-DenseNet structure diagram
4 云南大学学报(自然科学版) http://www.yndxxb.ynu.edu.cn 第 44 卷

表 1 MS-DenseNet 参数信息
Tab. 1 MS-DenseNet parameter information

层名称 处理过程 输出

Conv1 Conv:7×7 112×112×64

Pool1 Maxpool:3×3 56×56×64


 
 Gconv : 1 × 1 
 : 1 × 1, Conv : 3 × 3 
多尺度特征提取  Gconv  56×56×128
 Maxpooling : 3 × 3, Conv : 1 × 1 
 
Gconv : 1 × 1, 2 × Conv : 3 × 3
Pool2 Avgpool:2×2 28×28×128
( )
Conv : 1 × 1
密集连接块 28×28×512
Conv : 3 × 3
Pool3 Avgpool:2×2
( )
跳跃连接
Conv2 14×14×512
Conv : 1 × 1, Conv : 3 × 3
Pool4 Avgpool:2×2 7×7×512
GlobalAveragepool
全连接层 6
Fc, n=6

步骤 2 将步骤 1 得到的特征图输入进分组
表 2 各类矿物数据统计
卷积并在每层第一层使用批标准化层进行归一化
Tab. 2 Statistics of various minerals
处理,使用 ReLU 激活函数进行激活,送入三卷积
矿物类别 训练集 验证集 测试集
分支和最大池化支路,并行进行特征提取操作. 将
斑铜矿(Bornite) 678 84 84
各支路获取的信息进行融合. 在以平均池化操作整
合全局空间信息,并进一步缩减特征图尺寸. 硅孔雀石(Chrysocolla) 787 98 98

步骤 3 对步骤 2 得到的特征,进行密集卷积 赤铁矿(Hematite) 665 81 75


运算挖掘粗粒度信息,以平均池化压缩特征图 孔雀石(Malachite) 879 110 110
尺寸. 黄铁矿(Pyrite) 769 96 96
步骤 4 将步骤 3 得到特征图输入带有跳跃 石英石(Quartz) 788 99 98
连接的卷积层,进行卷积运算. 并将运算后的特征
送入全连接层,使用 softmax 激活函数计算各类型 2.2 实验设置 在图像输入网络前,将图像统一
矿物的概率. 为 224×224. 损失函数为交叉熵损失函数,使用 Adam
优化器. 学习率为自然指数衰减,初始学习率设为
2 实验与结果分析
0.001,衰减率设为 0.05,其数学表示如下:
2.1 实验数据及平台 矿物识别图像数据集中所 ( s)
l = l′ exp −r ′ (4)
有数据来源于互联中最大的矿产资源数据库平台 s
Mindat.org,使用爬虫方法收集到的 6 类矿物图像, 式中, l′表示初始学习率, r 为衰减率, s 为迭代次数,
合计 5 695 张,各类矿物分布如表 2 所示. 选取数 s′为衰减次数.
据集的 80% 作为训练集,10% 作为验证集,10% 作 使用自然指数衰减学习率能够加快网络训练
为测试集. 并对训练集进行随机上下翻转、随机左 速度,而且变化的学习率能够提升网络抗干扰性使
右翻转等数据增强操作扩充训练集,实验电脑配置 其不易陷入局部最小值. 每次迭代选取 16 张图像
为:AMD Ryzen 7 4800H 2.90 GHz 处理器,NVIDIA 送入网络进行训练,训练次数(epochs)为 1 000 次.
GeForce RTX 1650 显 卡 , 使 用 Python 语 言 和 2.3 网络评估 本文以测试集的准确率 (A) 来评
Tensorflow2.3 深度学习平台进行网络训练. 判各个网络的分类性能,使用参数量评价网络模型
第 44 卷 杨 彪等:基于多尺度密集连接网络的矿物图像智能识别 5

大小,使用混淆矩阵、精确度 (P )、召回率 (R) 和 FS 准 确 率 为 86.63%; ResNet50[21] 准 确 率 为 85.67%;


来评价各网络对矿物的识别能力. 根据实验中真实 MobileNetV2[22] 准 确 率 为 85.11%;VGG19[23] 网 络
情况和预测结果之间的关系,把实际结果和预测结 准确率为 83.09%,验证集对比结果如图 6 所示.
果之间的差异分为 4 种类别:实际为正样本预测也
为正样本 (T P)、实际为负样本预测为正样本 (FP )、
实际为正样本预测为负样本 (FN)、实际为负样本
预测为负样本 (T N ).
准确率,精确度,召回率及 FS 的计算公式如下:
TP + TN
A= . (5)
T P + F P + T N + FN
TP
P= . (6)
T P + FP
TP
R= . (7)
T P + FN

(1 + β2 )RP
FS = , (8)
β2 P + R
图 6 各模型验证集准确率对比
式中, β 是调整精确度和召回率在 FS 中的权重. 根 Fig. 6 Accuracy comparison of validation sets for each model
据两者的重要程度进行选择,若认为召回率重要,
则增大 β ;若认为精确度重要,则减小 β ;当 β = 1时 从各个模型准确率对比结果可知,在矿物数据
认为二者一样重要. 对于矿物识别任务,我们更关 集上 MS-DenseNet 的总体鉴别性能要好于 VGG19、
注识别准确度,所以在 FS 中设置 β = 0.5. ResNet50 和 InceptionV3 经典网络,和同量级网络
2.4 与典型经典网络对比实验 为了验证本文提 MobileNetV2 和 DenseNet121 相比,本文所提方法
出的方法的有效性,在使用相同数据集和同样的预 也取得了较优的成绩.
处理条件下,将本文方法与 5 种典型图像分类网络 表 3 为各个模型在测试集评价指标对比表,从
在验证集和测试集上分别进行横向对比. 经过 1 000 表中最后一列可以看出,本文所提方法的参数量要
次训练后各个网络在训练集均得到了充分训练,准 高于 MobileNetV2,但本文方法在其他评价指标上,
确率均达到了 100%,如图 5 所示. 比 MobileNet 高 3 到 4 个百分点,说明本文方法以
牺牲较小的计算复杂性为代价,换取比同量级网络
更高的识别识别性能. 在与其他网络评价指标对比
中发现,无论是在精确度、召回率和 FS 还是测试集
准确率、参数量,本文所提方法都要好于其他网络,
证明本文所提模型可以胜任在普通计算机上的矿
物识别任务.
图 7 给出了在测试集整体识别准确率较高的
网络的混淆矩阵对比图. 在测试集准确率排名前 3
的网络分别为 MS-DenseNet、DenseNet 和 Inception.
从混淆矩阵对比可以看出,3 个网络对赤铁矿易发
生误判.MS-DenseNet 对赤铁矿的识别准确率仅为
72%, 相 比 InceptionV3 和 DenseNet121 表 现 较 差 ;
图 5 各模型训练集准确率对比 而 InceptionV3 对这类矿物识别效果较好,准确率
Fig. 5 Accuracy comparison of training sets of each model 达到了 77% 左右. 但在硅孔雀石和孔雀石的这两
在验证集上,MS-DenseNet 准确率达到 90.54%; 类极为相似的矿物鉴别,MS-DenseNet 鉴别效果要
DenseNet121[17] 准确率达到 87.76%;InceptionV3[20] 优于其他两个网络. 对于斑铜矿的鉴定,DenseNet121
6 云南大学学报(自然科学版) http://www.yndxxb.ynu.edu.cn 第 44 卷

表 3 各模型在测试集评价指标
Tab. 3 Comparison of evaluation indicators of each model

网络名称 准确率/% 精确度/% 召回率/% FS/% 参数量/MB

DenseNet121 86.27 86.00 86.20 86.18 9.35

InceptionV3 86.43 86.18 85.76 85.95 22.81

ResNet50 85.03 84.30 84.23 84.29 89.93

MobileNetV2 85.03 84.68 84.55 84.65 8.64

VGG19 83.07 82.67 82.53 82.64 288.45

本文方法 88.06 87.68 87.33 87.61 8.74

相比另外两个网络表现较好. 虽然各网络对各类矿 流通;在网络终端,以跳跃连接方式进行信息增强,


物表现出不同的判定能力,但是各网络对 6 类矿物 减少特征图压缩过程中的信息丢失. 从对比结果来
整体识别准确率都在 85% 以上,而且本文所提方 看,本文所提改进点是有效的.
法整体精准度要优于其他两类网络,尤其在硅孔雀
表4 网络结构评价与指标对比
石、孔雀石、黄铁矿和石英判定上,误判发生的概
Tab. 4 Network structure evaluation and index comparison
率较低.
网络名称 Inception 跳跃连接 准确率/%
2.5 消融实验与识别热力图 为了验证 MS-DenseNet
在网络结构上的改进更能有效地提取矿物特征,本 DenseNet − − 86.27

节对原始的 DenseNet、结合改进多分支结构的 I- I-DenseNet √ - 86.99


DenseNet、结合跳跃连接结构的 S-DenseNet 以及 S-DenseNet − √ 87.13
本文方法进行了对比. 并以测试集准确率作为评价 MS-DenseNet √ √ 88.06
指标,各个网络训练设置相同对比结果如表 4 所示. 注:表中“−”表示未使用该结构
从表 4 可知最优网络的预测准确率为 88.06%,
该网络是在 DenseNet 基础上,融入跳跃连接结构 除实验外,本文还将 MS-DenseNet 在训练过程
和多尺度卷积结构. 在网络前期,通过使用多尺度 中学习到的矿物特征以及重要程度做了可视化展
卷积可以耦合不同尺度的矿物特征信息,这些信息 示,如图 7 所示,输出前三的最大可能类别. 从矿物
能有效帮助网络进行矿物判别;在以密集连接方式, 特征图对比中可发现,每条分支所提取到特征是不
将前面提取到的多尺度信息与下层网络进行交互, 同的,既有全局特征,也有局部特征,这印证了上文
在丰富下层网络输入特征的多样性同时加强信息 所述的多尺度卷积具有良好的尺度适应性. 同时本

图 7 混淆矩阵对比
Fig. 7 Confusion matrix comparison
第 44 卷 杨 彪等:基于多尺度密集连接网络的矿物图像智能识别 7

注:图中“—”表示无数据
图 8 矿物特征图与类激活热力图
Fig. 8 Mineral feature map and class activation heatmap.

文所提多尺度结构兼具低参数量优势,相比传统卷 少图像中的干扰因素,从而进一步提升网络的性能.
积结构本文算法所需计算内存低,便于日后在便携
参考文献:
式设备上进行应用. 类激活热力图是将所提取特征
[1] 彭苏萍. 我国煤矿安全高效开采地质保障系统研究现
对于网络识别矿物种类的重要性作了展示,如果提
状及展望[J]. 煤炭学报, 2020, 45(7): 2 331-2 345.
取到信息对网络最后的判别越重要,那么该位置的 Peng S P. Research status and prospect of geological
激活强度就越大,即反映出的颜色也就越鲜艳. 通 guarantee system for safe and efficient mining of coal
过类激活热力图和 Top-3 最大可能矿物概率,给出 mines in my country[J]. Journal of China Coal Society,
了网络找到了不同种类矿物的不同之处,对于一些 2020, 45(7): 2 331-2 345.
[2] 王银双, 杨彪, 杜婉, 等. 微波加热固体颗粒类矿物的
重要特征做了明显标记,提升了工作效率.
过程控制分析[J]. 化工自动化及仪表, 2021, 48(1): 20-
3 结束语 23.
Wang Y S, Yang B, Du W, et al. Process control ana-
为了避免识别网络结构规模庞大、计算复杂 lysis of microwave heating of solid granular
度高问题,同时在有限数据集训练情况下,网络模 minerals[J]. Control and Instruments in Chemical In-
型具备矿物的识别性能,本文提出 MS-DenseNet 矿 dustry, 2021, 48(1): 20-23.
[3] 郝慧珍, 顾庆, 胡修棉. 基于机器学习的矿物智能识别
物智能识别模型. 通过在密集连接网络中引入多尺
方法研究进展与展望[J]. 地球科学, 2021, 46(9): 3 091-
度卷积结构并使用分组卷积策略对网络进行优化, 3 106.
使其具有不同尺度特征学习能力,减少特征信息损 Hao H Z, Gu Q, Hu X M. Research progress and pro-
失同时保证较低网络参数数量;其次在深层网络的 spects of intelligent mineral recognition method based
尾部采用跳跃连接结构,实现耦合上下层的信息并 on mmachine learning[J]. Earth Science, 2021, 46(9):
3 091-3 106.
减少了深层网络的信息丢失. 为了验证本文方法有
[4] Baykan N A, Ylmaz N, Kansun G, et al. Case study in
效性,在本文数据集上进行了网络结构对比实验和
effects of color spaces for mineral identification[J]. Sci-
与 5 种典型网络对比实验,结果表明,本文所提方
entific Research and Essays, 2010, 5(11): 1 243-1 253.
法在测试集预测准确率均高于其他 5 种网络,达 [5] Singh N, Singh T N, Tiwary A, et al. Textural identific-
到 88.06%,所提改进点有助于提升网络性能. 由于 ation of basaltic rock mass using image processing and
图像质量对网络模型的特征提取能力有着重要影 neural network[J]. Computational Geosciences, 2010,
响,未来将采用目标检测网络对图像进行预处理减 14(2): 301-310. DOI: 10.1007/s10596-009-9154-x.
8 云南大学学报(自然科学版) http://www.yndxxb.ynu.edu.cn 第 44 卷

[6] Chauhan S, Ruehaak W, Khan F, et al. Processing of [14] 张野, 李明超, 韩帅. 基于岩石图像深度学习的岩性自
rock core microtomography images: Using seven differ- 动识别与分类方法[J]. 岩石学报, 2018, 34(2): 333-
ent machine learning algorithms[J]. Computers & 342.
Geosciences, 2012, 86(1): 120-128. Zhang Y, Li M C, Han S. Lithology automatic recogni-
[7] Baklanova O E, Baklanov A, Shvets O Y. Methods and tion and classification method based on deep learning of
algorithms of computer vision for automated pro- rock image[J]. Acta Petrologica Sinica, 2018, 34(2):
cessing of mineral rocks images[C]//2015 IEEE 10th 333-342.
Jubilee International Symposium on Applied Computa- [15] 彭伟航, 白林, 商世为, 等. 基于改进 InceptionV3 模型
tional Intelligence and Informatics, Timisoara, Ro- 的 常 见 矿 物 智 能 识 别 [J]. 地 质 通 报 , 2019, 38(12):
mania, 2015: 449-454. 2 059-2 066.
[8] 贺金鑫, 陈圣波, 王阳, 等. 一种基于朴素贝叶斯分类 Peng W H, Bai L, Shang S W, et al. Intelligent recogni-
模型的高光谱矿物精确识别方法[J]. 光谱学与光谱 tion of common minerals based on improved Incep-
分析, 2014, 34(2): 505-509. DOI: 10.3964/j.issn.1000- tionV3 model[J]. Geological Bulletin, 2019, 38(12):
0593(2014)02-0505-05. 2 059-2 066.
He J X, Chen S B, Wang Y, et al. An accurate recogni- [16] 李明超, 刘承照, 张野, 等. 耦合颜色和纹理特征的矿
tion method of hyperspectral minerals based on naive 物图像数据深度学习模型与智能识别方法[J]. 大地
Bayes classification model[J]. Spectroscopy and Spec- 构造与成矿学, 2020, 44(2): 203-211.
tral Analysis, 2014, 34(2): 505-509. Li M C, Liu C Z, Zhang Y, et al. A deep learning mod-
[9] 刘珏先, 滕奇志, 王正勇, 等. 基于协同表示的多特征 el and intelligent recognition method for mineral image
融合岩石分类[J]. 计算机应用, 2016, 36(3): 854-858. data coupled with color and texture features[J]. Geotec-
DOI: 10.11772/j.issn.1001-9081.2016.03.854. tonica et Metallogenia, 2020, 44(2): 203-211.
Liu J X, Teng Q Z, Wang Z Y, et al. Multi-feature fu- [17] Huang G, Liu Z, Laurens V, et al. Densely connected
sion rock classification based on collaborative repres- convolutional networks[C]//Proceedings of the IEEE
entation[J]. Journal of Computer Applications, 2016, Conference on Computer Vision and Pattern Recogni-
36(3): 854-858. tion, Honolulu, Hawaii, USA, 2017: 2 261-2 269.
[10] 程国建, 郭文惠, 范鹏召. 基于卷积神经网络的岩石图 [18] S. Xie, R. Girshick, P Dollár, Z, et al. Aggregated resid-
像分类[J]. 西安石油大学学报:自然科学版, 2017, ual transformations for deep neural networks[C]//Pro-
32(4): 116-122. ceedings of the IEEE Conference on Computer Vision
Cheng G J, Guo W H, Fan P Z. Rock image classifica- and Pattern Recognition, Honolulu, HI, USA, 2017:
tion based on convolutional neural network[J]. Journal 5 987-5 995.
of Xi'an Shiyou University: Natural Science Edition, [19] Szegedy C, Liu W, Jia Y Q, et al. Going deeper with
2017, 32(4): 116-122. convolutions [C]//Proceedings of the IEEE Conference
[11] 白林, 魏昕, 刘禹, 等. 基于 VGG 模型的岩石薄片图 on Computer Vision and Pattern Recognition, Boston,
像识别[J]. 地质通报, 2019, 38(12): 2 053-2 058. MA, USA, 2015: 1-9.
Bai L, Wei X, Liu Y, et al. Image recognition of rock [20] Szegedy C, Vanhoucke V, Ioffe S, et al. Rethinking the
slices based on VGG model[J]. Geological Bulletin, inception architecture for computer vision[C]//Proceed-
2019, 38(12): 2 053-2 058. ings of the IEEE Conference on Computer Vision and
[12] 郭艳军, 周哲, 林贺洵, 等. 基于深度学习的智能矿物 Pattern Recognition, Las Vegas, NV, USA, 2016:
识别方法研究[J]. 地学前缘, 2020, 27(5): 39-47. 2 818-2 862.
Guo Y J, Zhou Z, Lin H X, et al. Research on intelli- [21] He K, Zhang X, Ren S, et al. Deep residual learning for
gent mineral recognition method based on deep learn- image recognition[C]//Proceedings of the IEEE Confer-
ing[J]. Earth Science Frontier, 2020, 27(5): 39-47. ence on Computer Vision and Pattern Recognition, Las
[13] 徐述腾, 周永章. 基于深度学习的镜下矿石矿物的智 Vegas, NV, USA, 2016: 770-778.
能识别实验研究[J]. 岩石学报, 2018, 34(11): 3 244- [22] Sandler M, Howard A, Zhu, M, et al. MobileNetV2: In-
3 252. verted residuals and linear bottlenecks[J]. arXiv:
Xu S T, Zhou Y Z. Experimental research on intelli- 1801.04381, 2018.
gent recognition of minerals under mirror based on deep [23] Simonyan K, Zisserman A. Very deep convolutional
learning[J]. Acta Petrologica Sinica, 2018, 34(11): networks for large-scale image recognition[J]. arXiv:
3 244-3 252. 1409.1556, 2014.
第 44 卷 杨 彪等:基于多尺度密集连接网络的矿物图像智能识别 9

Intelligent recognition of mineral images based on multi-scale densely


connected convolutional network

YANG Biao1,2,3**,MA Yi-ji1,2,NI Rui-pu1,2,SU Sen-tao1,2,ZENG De-ming1,2


(1. Faculty of Information Engineering and Automation, Kunming University of Science and
Technology, Kunming 650500, Yunnan, China;
2. Yunnan Key Laboratory of Artificial Intelligence, Kunming University of Science and
Technology, Kunming 650500, Yunnan, China;
3. The Key Laboratory of Unconventional Metallurgy, Ministry of Education, Kunming University of Science and
Technology, Kunming 650093, Yunnan, China)

Abstract: Traditional networks of determining mineral species require high environmental resources for their
application deployment due to high computational complexity and large network parameters. To solve this
problem, a multi-scale densely connected convolutional network (MS-DenseNet) is proposed. Firstly, in order to
make the network have multi-scale feature learning ability, a multi-scale convolution structure is introduced in
densely connected networks. Secondly, a group convolution strategy is used to optimize the network structure.
Finally, the skip connection structure is used at the end of the network to reduce the loss of feature information.
The experimental results on a self-built mineral dataset show that the accuracy of validation set and test set of the
network model is 90.54% and 88.06% respectively and the MS-DenseNet has good recognition ability.
Key words: mineral images;multi-scale dense connection;grouped convolution;intelligent recognition;
network model

You might also like