Professional Documents
Culture Documents
3
2 0 2 0 年6 月 MATERIALS SCIENCE AND TECHNOLOGY Jun. 2020
深度学习在材料显微图像分析中的应用与挑战
1,
2,3
班晓娟 ,宿彦京1,4 ,谢建新1,4
( 1. 北京科技大学 北京材料基因工程高精尖创新中心,
北京 100083; 2. 材料领域知识工程北京市重点实验室( 北京科技大学) ,
北京 100083; 3. 北京科技大学 计算机与通信工程学院,
北京 100083; 4. 北京科技大学 新材料技术研究院,
北京 100083)
摘 要: 材料的组织结构主要受成分和制备加工工艺的影响,是决定材料性能的关键因素,在材料研发的全周期内具有
重要作用。材料组织结构以非结构化图像数据的形式呈现,利用人工经验性的手段进行分析和信息抽取,遗漏了大量的
材料学信息和隐含知识。深度学习技术的发展和应用,为材料显微图像中信息的精准、快速、自动获取提供了重要的研
究手段。本文从图像处理、图像分析和图像理解 3 个方面概述了材料显微图像处理与信息挖掘的主要研究内容和关键
技术,详细介绍了深度学习在图像分析中的图像识别、图像分割和图像生成 3 个任务中的研究进展,讨论了深度学习在
材料显微图像分析和信息挖掘中的发展方向和挑战。
关键词: 材料显微图像分析; 机器学习; 深度学习; 计算机视觉; 图像处理
中图分类号: TPB391 文献标志码: A 文章编号: 1005 - 0299( 2020) 03 - 0068 - 08
( 1. Beijing Advanced Innovation Center for Materials Genome Engineering,University of Science and Technology Beijing,
Beijing 100083,China; 2. Beijing Key Laboratory of Knowledge Engineering for Materials Science ( University of Science
and Technology Beijing) ,Beijing 100083,China; 3. School of Computer and Communication Engineering,University of
Science and Technology Beijing,Beijing 100083,China; 4. Institute for Advanced Materials and Technology,University
of Science and Technology Beijing,Beijing 100083,China)
Abstract: The structure of materials is mainly affected by the composition and processing technology,which is
the key factor to determine the performance of materials and plays an important role in the whole cycle of
material research and development. The material microstructure is presented in the form of unstructured image
data,which is usually analyzed and extracted by means of artificial experience,leaving out a lot of material
information and implicit knowledge. The development and application of deep learning technology provide an
important research means for the accurate, fast, and automatic acquisition of information in material
microscopic image. In this work,the main research contents and key technologies of material microscopic
image processing and information mining were summarized from three aspects of image processing,image
analysis,and image understanding. The research progress of deep learning in image recognition,image
segmentation,and image generation in image analysis was introduced in detail. The development directions
and challenges for the application of deep learning in material microscopic image analysis and information
mining were also discussed.
Keywords: material microscopic image analysis; machine learning; deep learning; computer vision;
image processing
收稿日期: 2020 - 05 - 05.网络出版日期: 2020 - 06 - 15.
基金项目: 国家重点研发计划项目( 2016YFB0700500) . 成分 - 工艺 - 组织结构 - 性能的构效关系是
作者简介: 班晓娟( 1970—) ,女,教授; 材料性能提升、质量控制和新材料研发的基础。
谢建新( 1958—) ,男,教授,中国工程院院士.
通信作者: 谢建新,E-mail: jxxie@ mater. ustb. edu. cn
近年来,机器学习在材料成分、工艺、性能等结构
[1 - 3]
期刊网址: http: / / hit. alljournals. cn / mst_cn / ch / index. aspx 化数据的分析和挖掘中取得了明显的进展 。
第3 期 班晓娟,等: 深度学习在材料显微图像分析中的应用与挑战 · 69·
图1 材料显微图像处理与信息挖掘的主要研究内容和关键技术
Fig. 1 Main research contents and key technologies of material microscopic image processing and information mining
材料显微图像分析。指对材料显微图像整体
3 深度学习在材料显微图像分析中的应用
或局部的处理,可根据像素之间的相关关系分析
和提取组织图像中的材料学信息,包括材料显微 材料显微图像分析包括图像识别、分割和生
图像 识 别、材 料 显 微 图 像 分 割 和 材 料 显 微 图 像 成等任务。本章首先对图像识别、图像分割和图
生成。 像生成 3 个容易混淆的应用展开对比说明,
见图 2,
材料显微图像理解。指在材料显微图像处理 然后对上述 3 个应用展开详细叙述。
和分析基础上,
对显微图像中蕴含的材料学信息进
行分析和整合。如二维或三维组织结构表征、组织
演变规律发现、
成分 - 工艺 - 组织 - 性能关系的挖
掘,
最终依据获得的材料学规律辅助新材料设计。
近年来,由于深度学习在图像相关的各项任
务中均展现出超越传统算法的优越性,为材料显
微图像的自动化分析提供了新的解决方案 。材料
科研工作者开始尝试将深度学习应用到图 1 所
述的材料显微图像处理与信息挖掘的各项相关任
务中。 图2 图像识别、图像分割和图像生成任务示意
而在所有研究任务中,材料显微图像识别、图 Fig. 2 Schematic diagram of image recognition,image seg-
与材料学信息挖掘,以及材料显微图像理解具有 图像识别。该应用指向模型输入单张图像,
紧密 的 联 系,且 已 取 得 了 富 有 成 效 的 研 究 成 模型对图像整体分析后,输出单个评估结果。 该
果
[22]
。下文将针对材料显微图像分析任务中 3 结果若为离散值,则模型执行分类任务,如判断该
种应用进行详细介绍。 图像属于哪种合金组织。 若该结果为连续值,则
第3 期 班晓娟,等: 深度学习在材料显微图像分析中的应用与挑战 · 71·
该模型执行回归任务,如预测该图像的宏观性能 学习的强有效特征提取能力,该方法已成功应用
或成分组成。 于多种材料识别任务中,并取得有成效的效果。
图像分割。该应用指向模型输入单张图像, 但由于深度学习的黑盒特性,科研人员尚不能通
模型对图像每个区域分析后,输出每个像素的分 过简单的数学公式表征深度学习所识别的特征 ,
类结果,该结果可进一步用于组织比例统计以及 对特征理解与优化提出了挑战。
形状尺寸表征。图像分割和图像识别模型均可得 3. 2 材料显微图像分割
到图像的相关信息,但图像分割得到的结果更为 随着深度学习在自然场景图像分割任务中取
直观,有利于定量地表征微观组织结构特征 。 得的突破,Ronneberger 于 2015 年提出了 U - Net
图像生成。该应用指向模型输入材料学信息 网络,并成功用于电子显微镜下生物细胞图像的
[41]
( 参数、语义图、线段图等 ) ,模型生成与该材料学 分割,取得了当年 ISBI 细胞识别竞赛的冠军 。
信息相关的合成图像。生成的图像可以作为数据 经过在 不 同 数 据 集 上 的 重 复 性 实 验,Falk 等 于
增广策略扩充现有的材料显微图像数据,进而在 2019 年在 Nature 子刊发表文章,称 U - Net 被证
训练过程中提高深度学习算法的泛化能力 。 明在生物医学和材料科学领域的图像处理任务中
[42]
3. 1 材料显微图像识别 具有极强的鲁棒性 。
随着深度学习在自然场景图像识别任务中取得 在材料显微图像分析应用中,相对于图像识
了突破进展,
材料科研人员尝试将传统由人类专家 别任务,对材料显微组织进行像素级别的图像分
人工主观对图像识别的任务交给深度学习进行处 割,可定量地对图像中不同相的组成进行统计和
理,
旨在用深度学习自动提取图像中可用于显微组 分析,进而为宏微观内禀关系分析提供数据支撑 。
织识别的强有效特征,进而消除人工识别的不确定 因此,图像分割模型在材料显微图像分析中得到
性,
有效、快速且自动地对材料显微图像进行识别。 了较为广泛的应用。
Adachi 等首先将卷积神经网络引入钢的微 Azimi 等首先对 FCN 深入研究并结合材料组
观结构识别任务中,实验证明该方法具有极高的 织的特性,将 FCN 与最大表决法相结合,提出了
[37]
识别鲁 棒 性 。Yamamoto 提 出 一 种 神 经 网 络 一种 新 型 的 针 对 材 料 显 微 组 织 的 分 割 算 法
GCNN,可对每一种测试材料的形成能、单位晶胞 MVFCNN[15],与当时最先进的材料显微组织分割
体积、带隙、总磁化率等特征进行预测,进而使用 技术相比,将精确度从 48. 89% 提高到 93. 94% ,
上述特征对金属 - 绝缘体和非磁性–磁性体进行 取得 了 显 著 的 进 步,其 示 意 图 如 图 3 所 示。
[38]
二元分类 。Ruelas 等使用人工神经网络识别 Decost等提出一种深度卷积神经网络,可以实现
高温条件下导体材料的不同物理状态 ( 如球化、 复杂微观结构的分割,能够从含有多种微观成分
脱碳还是石墨化 ) 。 实验表明,所提出的识别算 的复杂的微观图中获得水灰石粒度和变质区宽度
[43]
法与人类专家相比获得了 96. 83% 的准确率,且 的分布 。Li 等结合卷积神经网络和图像局部
[39]
效率更高 。Wang 等通过实验证明深度卷积神 分析方法开发了一套适用于不同对比度、亮度和
[44]
经网络对 X 射线散射图像进行分类的准确率超 磁化 的 组 织 图 像 中 缺 陷 的 自 动 检 测 工 具 。
[40]
过人工识别结果 。 Maksov 等提出了基于深度学习的动态 STEM 成
上述方法直接向深度学习模型输入图像,并 像分析模型,可在几秒内从原始的 STEM 数据中
[45]
训练深度学习模型输出图像识别结果 。由于深度 提取出数千个晶格缺陷 。
图3 MVFCN[15] 图像分割模型示意图
Fig. 3 Schematic diagram of image segmentation model MVFCN[15]
· 72· 材 料 科 学 与 工 艺 第 28 卷
中仅能获得小样本数据,如何有效利用迁移学习、 由于材料显微图像数据的复杂性,深度学习
半监督学习、自监督学习和无监督学习等手段 ,提 在材料显微图像分析领域还存在众多挑战 。例如
高模型在小样本数据情况下的特征提取能力是今 特征可解释性分析问题、小样本数据高效分析问
后研究的重点。 题、大尺寸材料显微组织三维或四维精准高效重
4. 3 面向材料显微图像分割的三维或四维精准 构及全信息表征问题,以及材料显微图像生成中
高效重构问题 材料学信息一致性约束问题等。这些问题已成为
在材料研究领域中,研究人员通常采用系列 材料科学下一步研究中的难点与热点 。
截面法获得材料组织的多层截面,并从截面中构 本文仅对深度学习在材料显微图像分析的应
建材料的三维结构。 当前,基于深度学习的图像 用展开综述,而在图像处理和图像理解的任务中
特征提取技术在二维图像数据分析中取得了初步 深度学习也展示了相较于传统方法的优越性 ,在
成果。但是,由于深度卷积网络模型常具有极高 未来的研究中,将会有更多的深度学习方法应用
的空间复杂度,在有限的硬件资源前提下难以直 于材料显微图像处理、分析和理解的相关任务中。
接对大尺寸三维数据进行分析和处理,如何有效
利用材料截面的三维信息,对大尺寸三维材料显
参考文献:
微组织精准且高效的分析是研究难点。 同时,材 [1] BUTLER K T,DAVIES D W,CARTWRIGHT H,et
Conference on Computer Vision. Piscataway, NJ: [19] European Union Aviation Safety Agency. EASA
IEEE,2017: 2980 - 2988. artificial intelligence roadmap———A human-centric
DOI: 10. 1109 / ICCV. 2017. 322 approach to AI in aviation[EB / OL]. ( 2020 - 07 -
[10] CHEN L,PAPANDREOU G,KOKKINOS I,et al. 02) . https: / / www. easa. europa. eu / document-library /
DeepLab: Semantic image segmentation with Deep general-publications/ easa-artificial-intelligence-roadmap -10.
Convolutional Nets, atrous convolution, and fully [20] The White House, National Quantum Coordination
connected CRFs[J]. IEEE Transactions on Pattern Office. A strategic vision for American' s quantum
Analysis and Machine Intelligence,2018,40 ( 4 ) : networks[EB / OL]. ( 2020 - 02 - 12 ) . https: / /
834 - 848. quantumcomputingreport. com / white-house-national-
DOI: 10. 1109 / TPAMI. 2017. 2699184 quantum-coordination-office-releases-a-strategic-vision-
[11] 冯 海. 基 于 深 度 学 习 的 中 文 OCR 算 法 与 系 统 实 for-americas-quantum-networks / .
现[D]. 深圳: 中国科学院大学( 中国科学院深圳先 [21] The White House. President Trump's FY 2021 budget
进技术研究院) ,2019. commits to double investments in key industries of the
FENG Hai. Chinese OCR algorithm and system future[EB / OL]. ( 2020 - 02 - 11 ) . https: / / www.
implementation based on deep learning [D ]. whitehouse. gov / briefings-statements / president-trumps-
Shenzhen: Institutes of Advanced Technology,Chinese fy-2021-budget-commits-double-investments-key-
Academy of Sciences,2019. industries-future / .
DOI: 10. 27822 / d. cnki. gszxj. 2019. 000014 [22] MA Boyuan,BAN Xiaojuan,HUANG Haiyou,et al.
[12] 刘小沣. 基于深度学习的人脸图像识别技术的研 Deep learning-based image segmentation for Al - La
究[D]. 长春: 中国科学院大学( 中国科学院长春光 alloy microscopic images[J]. Symmetry,2018,10
学精密机械与物理研究所) ,2019. ( 4) : 107 - 120.
LIU Xiaofeng. Research on the technology of deep DOI: 10. 3390 / sym10040107
learning based face image recognition [ D ]. [23] LUO M C, LIU L. Generative model for material
Changchun: Changchun Institute of Optics, Fine irradiation experiments based on prior knowledge and
Mechanics and Physics, Chinese Academy of attention mechanism [ J ]. NIPS2018 MMLM
Sciences,2019. Workshop,2018.
[13] 陈宇鹏. 基于深度学习的自动驾驶单目视觉目标识 [24] LECUN Y, BOSER B, DENKER J S, et al.
别技术研究[D]. 长春: 吉林大学,
2019. Backpropagation applied to handwritten zip code
CHEN Yupeng. Research based on deep learning for recognition[J]. Neural Computation,1989,1 ( 4 ) :
autonomous driving monocular vision object detection 541 - 551.
technology[D]. Changchun: Jilin University,2019. DOI: 10. 1162 / neco. 1989. 1. 4. 541
[14] 王苏振. 基于深度学习的手势识别技术研究[D]. [25] SIMONYAN K,ZISSERMAN A. Very deep convolutional
杭州: 浙江大学,
2019. networks for large-scale image recognition[R]. arXiv:
WANG Suzhen. Research on gesture recognition 1409. 1556,2014.
technology based on deep learning[D]. Hangzhou: [26] SZEGEDY C,LIU W,JIA Y,et al. Going deeper
Zhejiang University,2019. with convolutions [C]/ / Proceedings of 2015 IEEE
[15] AZIMI S M, BRITZ D, ENGSTLER M, et al. Conference on Computer Vision and Pattern
Advanced steel microstructural classification by deep Recognition. Piscataway,NJ: IEEE,2015: 1 - 9.
learning methods [J]. Scientific Reports,2018,8 DOI: 10. 1109 / CVPR. 2015. 7298594
( 1) : 1 - 14. [27] HUANG G,LIU Z,VAN DER MAATEN L,et al.
DOI: 10. 1038 / s41598 - 018 - 20037 - 5 Densely connected convolutional networks [C ]/ /
[16] ROSENBLATT F. The perceptron: A probabilistic Proceedings of 2017 IEEE Conference on Computer
model for information storage and organization in the Vision and Pattern Recognition. Piscataway, NJ:
brain[J]. Psychological Review,1958,65( 6) : 386. IEEE,2017: 4700 - 4708.
DOI: 10. 1037 / h0042519 DOI: 10. 1109 / CVPR. 2017. 243
[17] RUMELHART D E,HINTON G E,WILLIAMS R J. [28] HU J, SHEN L, SUN G. Squeeze-and-excitation
Learning representations by back-propagating errors[J]. networks [C ]/ / Proceedings of 2018 IEEE / CVF
Nature,1986,323( 6088) : 533 - 536. Conference on Computer Vision and Pattern
DOI: 10. 1038 /323533a0 Recognition. Piscataway,NJ: IEEE,2018: 7132 - 7141.
[18] HE K,ZHANG X,REN S,et al. Deep residual DOI: 10. 1109 / CVPR. 2018. 00745
learning for image recognition [C]/ / Proceedings of [29] SHELHAMER E,LONG J,DARRELL T,et al. Fully
2016 IEEE Conference on Computer Vision and Pattern convolutional networks for semantic segmentation[C]/ /
Recognition. Piscataway,NJ: IEEE,2016: 770 - 778. Proceedings of IEEE Transactions on Pattern Analysis
DOI: 10. 1109 / CVPR. 2016. 90 and Machine Intelligence. Piscataway, NJ: IEEE,
第3 期 班晓娟,等: 深度学习在材料显微图像分析中的应用与挑战 · 75·
2017,39( 4) : 640 - 651. DOI: 10. 2355 / tetsutohagane. TETSU - 2016 - 035
DOI: 10. 1109 / TPAMI. 2016. 2572683 [38] YAMAMOTO T. Crystal graph neural networks for
[30] GOODFELLOW I,POUGET-ABADIE J,MIRZA M, data mining in materials science [R]. Yokohama,
et al. Generative adversarial nets[C]/ / Proceedings of Japan: RIMCS LLC,2019.
the 27th International Conference on Neural [39] RUELAS-SANTOYO E A, VZQUEZ-LPEZ J A,
Information Processing Systems. Montreal: [s. n. ], YAEZ-MENDIOLA J, et al. System for the
2014: 2672 - 2680. recognition of wear patterns on microstructures of
[31] 王坤峰,苟超,段艳杰,等. 生成式对抗网络 GAN carbon steels using a multilayer perceptron [J].
的研究进 展 与 展 望 [J]. 自 动 化 学 报,2017,43 Ingeniería e Investigación,2018,38( 1) : 113 - 120.
( 3) : 321 - 332. [40] WANG B,YAGER K,YU D,et al. X-ray scattering
WANG Kunfeng,GOU Chao,DUAN Yanjie. et al. image classification using deep learning [C ]/ /
Generative adversarial networks: The state of the art Proceedings of 2017 IEEE Winter Conference on
and beyond[J]. Acta Automatica Sinica,2017,43 Applications of Computer Vision ( WACV ) .
( 3) : 321 - 332. Piscataway,NJ: IEEE,2017: 697 - 704.
DOI: 10. 16383 / j. aas. 2017. y000003 [41] RONNEBERGER O,FISCHER P,BROX T. U-net:
[32] KARRAS T, LAINE S, AILA T. A style-based Convolutional networks for biomedical image
generator architecture for generative adversarial segmentation [ C ]/ / Proceedings of International
networks[C]/ / Proceedings of the IEEE Conference on Conference on Medical Image Computing and
Computer Vision and Pattern Recognition. Piscataway, Computer-Assisted Intervention. Cham: Springer,
NJ: IEEE,2019: 4401 - 4410. 2015: 234 - 241.
DOI: 10. 1109 / CVPR. 2019. 00453 DOI: 10. 1007 /978 - 3 - 319 - 24574 - 4_28
[33] 宋晓艳. 体视学,图像分析与计算材料学之间的关 [42] FALK T,MAI D,BENSCH R,et al. U-Net: deep
系及进展[J]. 中国体视学与图像分析,2008,13 learning for cell counting,detection,and morphometry[J].
( 4) : 280 - 285. Nature Methods,2019,16( 1) : 67 - 70.
SONG Xiaoyan. Progress on the multi-disciplinary DOI: 10. 1038 / s41592 - 018 - 0261 - 2
relationship of stereology, image analysis and [43] DECOST B L,LEI B, FRANCIS T, et al. High
computational materials science [J]. Chinese Journal throughput quantitative metallography for complex
13( 4) : 280 -
of Stereology and Image Analysis,2008, microstructures using deep learning: A case study in
285. ultrahigh carbon steel [ J ]. Microscopy and
DOI: 10. 13505 / j. 1007 - 1482. 2008. 04. 005 Microanalysis,2019,25( 1) : 21 - 29.
[34] 章毓晋. 图像工程( 第四版) [M]. 北京: 清华大学 [44] LI W,FIELD K G,MORGAN D. Automated defect
出版社,2019. analysis in electron microscopic images [J]. NPJ
ZHANG Yujin. Image engineering [M]. 4th ed. Computational Materials,2018,4( 1) : 1 - 9.
Beijing: Tsinghua University Press,2019. DOI: 10. 1038 / s41524 - 018 - 0093 - 8
[35] 北京科技大学. 一种基于视频清晰度融合的大尺寸 [45] MAKSOV A, DYCK O, WANG K, et al. Deep
显微图像生成方法: CN201810432523. 1[P]. 2018 - learning analysis of defect and phase evolution during
10 - 04. electron beam-induced transformations in WS2 [J].
University of Science & Technology Beijing. A kind of NPJ Computational Materials,2019,5( 1) : 1 - 8.
large scale micro-image generation method based on [46] MA Boyuan,LIU Chuni,BAN Xiaojuan,et al. WPU-
video definition fusion: CN201810432523. 1 [P]. Net: Boundary learning by using weighted propagation
2018 - 10 - 04. in convolution network [ R ]. arXiv: 1905.
[36] MA Boyuan,BAN Xiaojuan,HUANG Haiyou,et al. A 09226,2019.
fast algorithm for material image sequential stitching[J]. [47] MA Boyuan,WEI Xiaoyan,LIU Chuni,et al. Data
Computational Materials Science,2019,158: 1 - 13. augmentation in microscopic images for material data
DOI: 10. 1016 / j. commatsci. 2018. 10. 044 mining[R]. arXiv: 1905. 04711,2019.
[37] YOSHITAKA A,MOTOKI T,SHOGO H. Microstructure ( 编辑 吕雪梅)
recognition by deep learning[J]. Tetsu-to-Hagane,
2016,102( 12) : 722 - 729.
本文引用格式:
班晓娟,宿彦京,谢建新. 深度学习在材料显微图像分析中的应用与挑战[J]. 材料科学与工艺,2020,28 ( 3) : 68 - 75.
DOI: 10. 11951 / j. issn. 1005 - 0299. 20200140.
BAN Xiaojuan,SU Yanjing,XIE Jianxin. Applications and challenges of deep learning in material microscopic image analysis
[J]. Materials Science and Technology, 2020,28( 3) : 68 - 75. DOI: 10. 11951 / j. issn. 1005 - 0299. 20200140.