Professional Documents
Culture Documents
基于文献计量学的人工智能领域研究现状及热点分析 刘龑龙
基于文献计量学的人工智能领域研究现状及热点分析 刘龑龙
doi:10.3969/j.issn.1000-7695.2021.10.005
基于文献计量学的人工智能领域研究现状及热点分析
刘龑龙 1,2,史冬梅 1,刘进长 1,唐 莉 2,王金鹏 3
(1. 科学技术部高技术研究发展中心,北京 100044;
2. 复旦大学国际关系与公共事务学院,上海 200433;
3. 之江实验室,浙江杭州 311121)
Liu Yanlong1,2 , Shi Dongmei1, Liu Jinchang1, Tang Li2, Wang Jinpeng3
(1.High Technology Research and Development Center, Ministry of Science and Technology, Beijing 100044, China;
2.School of International Relations and Public Affairs, Fudan University, Shanghai 200433, China;
3. Zhejiang Lab, Hangzhou 311121, China)
Abstract: On the basis of Scopus database and SciVal research evaluation tools, this paper analyzes the development and
research focus of artificial intelligence field from 2014 to 2019 from academic output, citation, academic influence and
other measurement indicators. The research finds that, global attention and academic output have continued to increase,
and relevant research has entered a stage of rapid development. Among them, American universities and enterprises are
in the leading position, Germany is the most influential in research institutions, while Chinese universities and research
institutes are the first in the world in academic output, but the quality and influence of achievements are still to be
improved, yet Chinese enterprises have outstanding performance and have entered the world's first echelon. Besides,
The research focus is mainly on two aspects of basic research and common key technologies, especially the basic
theory of model, algorithm and so on. Finally, according to the research results and the strategic measures of artificial
intelligence development in China, the paper puts forward some suggestions to promote the development of artificial
intelligence in China: to guide and encourage researchers to publish "three high" papers, to carry out cooperative
research, and to focus on basic theory and key common technologies to promote the cooperation between industry,
university and research and the transformation of achievements.
Key words: artificial intelligence; artificial intelligence research; academic output; bibliometrics; SciVal
1 研究背景 当今智能时代扮演着越来越重要的角色,不仅是改
变人类生活方式的重要途径,也是驱动科技发展和
人工智能(artificial intelligence,AI)研究领域
产业变革的重要力量。近年来,全球范围内掀起人
是在 1956 年达特茅斯学院召开的夏季研讨会上正式
工智能研究热潮,世界各国在人工智能领域积极布
确立,至今已有 64 年的发展历史[1]。人工智能在
局,纷纷制定相关科技战略、政策及计划,如美国
收稿日期:2020-10-04,修回日期:2020-11-24
基金项目:中国博士后科学基金面上项目“基于主题模型及多数据源的前沿技术识别”(2020M670254)
刘龑龙等:基于文献计量学的人工智能领域研究现状及热点分析 39
从表 1 和图 2 可以看出,研究期间的文献量逐
年增加,2019 年的发文量甚至是 2014 年的两倍以上,
这主要是因为随着人工智能研究热度的增加,越来
越多的学者投入对相关领域的研究。这一点也可以
从图 3 的参与学者数量增长趋势中得到印证。
图 2 人工智能领域文献数量趋势
刘龑龙等:基于文献计量学的人工智能领域研究现状及热点分析 41
图 3 人工智能领域参与学者数量趋势
图 6 人工智能领域文献篇均被引数量趋势
如图 4 所示在基金支持方面,研究期间人工智
能领域研究获得的资金支持整体也是呈现增长趋势,
虽然全球资金支持在 2015 年有个巨大增长后呈现些 如图 7 至图 9 所示,研究期间文献的归一化影
许回落,但在 2019 年又回到与 2015 年持平状态。 响因子、前 1% 和前 10% 高被引比例 3 个指数也是
逐年减小,结合表 1 中的文献量,说明领域内文献
数量虽然整体呈上升趋势,但其整体影响力是呈下
降趋势的。
图 4 人工智能领域研究资金支持趋势
从图 5 和图 6 可以看出,研究期间文献的总被
引和篇均被引都是逐年递减的,原因主要因为相较
于近期发表的文献,年限早的文献会获得更多的阅 图 7 人工智能领域文献归一化影响因子趋势
读量,后期研究的更多工作是基于早期文献的基础
来完成的。
3.1.4 按归属机构划分情况 值得注意的是,美国高校在国际合作占比方面普遍
高校、研究所、企业是不同类型的创新主体, 较低,其更倾向开展国内间的合作,主要原因是美
在技术创新中都起着至关重要的作用。在人工智能 国在人工智能研究方面走在世界前列。排在第 3 位
领域,高校是学术产出的核心机构,以 FWCI 为指 的苏黎世联邦理工学院是瑞士最富盛名的大学,在
标对具有一定发文规模的高校进行排序分析,2014 人工智能领域为瑞士贡献近 1/3 的学术产出。来自
至 2019 年人工智能领域 FWCI 排名前十的高校学术 沙特阿拉伯的阿卜杜勒阿齐兹国王大学和来自西班
产出情况如表 3 所示。其中,美国有 5 所高校进入 牙的格拉纳达大学分列第 5 位和第 7 位,其前 1%
前十,分列在第 1、2、4、8、9 位。再结合表 2 的 和前 10% 高被引比例均远远高于美国高校,但通
数据分析可知,在人工智能领域美国文献的平均影 过 SciVal 的数据深入挖掘发现,其产出的文献在世
响力位于世界前列,其个别高校具有世界顶尖水平。 界顶级期刊的占比远小于美国高校,故文献的影响
刘龑龙等:基于文献计量学的人工智能领域研究现状及热点分析 43
人工智能相关技术日趋成熟,企业在技术研发 术影响力高,学术产出文献量相对也较高,均高于
与创新方面发挥着主体作用。表 5 展示的是 2014 排名前十企业文献量的平均值。美国除了有排名前
至 2019 年人工智能领域 FWCI 前十的企业,可以发 三的企业,还有高通公司、雅虎实验室分别排名第 6、
现企业在人工智能领域所发挥的作用越来越大,尤 9 位,美国企业在人工智能领域占据了绝对领先地位。
其 是 Facebook、Alphabet、 微 软( 美 国) 等 公 司 的 我国科大讯飞、商汤科技、腾讯、百度公司分别排
FWCI 值高于高校与研究所。其中的企业大多来自美 名第 4、7、8、10 位,我国企业在人工智能领域的
国和中国,日本的软银集团排名第 5 位。值得关注 技术处于世界领先水平,但学术成果产量偏低。
的是,美国的 Alphabet 和微软(美国)公司不仅学
表 5 2014—2019 年人工智能领域 FWCI 前十企业情况统计
篇均被引 / 前 1% 高 前 10% 高 国际合作
序号 企业名称 所属国家 FWCI 文献量 / 篇 总被引 / 次
(次 / 篇) 被引比例 被引比例 占比
1 脸书( Facebook) 美国 6.89 138 6 347 46.0 8.7% 30.4% 50.7%
2 字母表(Alphabet) 美国 5.65 589 16 066 27.3 7.3% 24.6% 43.0%
3 微软(Microsoft) 美国 4.18 1 085 30 618 28.2 5.8% 25.9% 47.1%
4 科大讯飞股份有限公司 中国 3.76 26 513 19.7 7.7% 38.5% 42.3%
5 软件银行集团 日本 3.02 30 175 5.8 0 13.3% 50.0%
6 高通(Qualcomm) 美国 2.85 37 355 9.6 2.7% 18.9% 29.7%
7 商汤科技 中国 2.64 39 354 9.1 7.7% 25.6% 69.2%
8 腾讯 中国 2.59 165 1 299 7.9 4.8% 24.2% 57.0%
9 雅虎实验室(Yahoo Labs) 美国 2.50 131 2 744 20.9 4.6% 19.1% 48.1%
10 百度 中国 2.46 143 1 807 12.6 3.5% 24.5% 47.6%
平均值 3.65 238 6 027 18.7 5.3% 24.5% 48.5%
如图 14 所示,特征提取是机器学习中一个前处
理步骤,是人工智能领域算法的基础,近几年对特
征提取研究的关注度持续上升。数据挖掘、图像识
别是人工智能领域的基础技术,近几年这类技术研
究的总体热度上升,但在 2018 年以后发展趋于平稳,
在 2019 对其关注度略有减少。
图 11 人工智能领域前十关键词研究热度趋势
从图 12 可以看出,早期人工智能领域的应用主
要集中在动力学和机器人领域,但随着应用场景的
增多,对人工智能技术需求也随之提高,神经网络、
学习系统和分类问题成为关键的技术问题。
图 14 人工智能领域前 31 至 40 位关键词研究热度趋势
从图 15 可以看到,早期人工智能与机器人领域
相结合使控制论一度成为热点研究课题,但在 2017
年以后控制论的热度下降。卷积神经网络是深度学
习的代表算法,广泛应用在图像处理、视频处理等
方面,自 2014 年起研究热度持续增加。
图 12 人工智能领域前 11 至 20 位关键词研究热度趋势
从图 13 中也可以看出,在人工智能应用中,预
测和评估是两项关键的研究,越来越多的学者投入
到预测和评估的研究中。此外,通信技术受到越来
越多的关注,原因主要是随着应用场景的丰富,人
工智能也逐渐从单一智能向群体智能演进,因此通
信技术作为连接人工智能的纽带得到了更多的研究。
图 15 人工智能领域前 41 至 50 位关键词研究热度趋势
3.2.2 关键词分析
关键词是文献的主体部分之一,能够有效地反
映文献的核心内容,关键词网络节点的中心性可以
反映节点在网络中的重要程度以及与其他节点之间
关系的密切程度[12]。本研究通过 CiteSpace 分析工
具对 2014 至 2019 年人工智能领域前 1% 高被引文
献进行关键词共词分析,以反映人工智能领域研究
图 13 人工智能领域前 21 至 30 位关键词研究热度趋势 动态和趋势。如图 16 所示,以关键词的频次为计
46 刘龑龙等:基于文献计量学的人工智能领域研究现状及热点分析
领域的核心算法技术,为人工智能的应用提供算法
从图 16、图 17 可以看出,2014 至 2019 年人工
基础。
智能领域前 1% 高被引文献所关注的核心问题是人
工智能基础理论问题,这是人工智能领域最为核心
的框架与基础,具有继续发展及变革的能力;其次
是共性关键技术问题,往往是实现具体应用中的关
键技术,是基础理论具象的表达形式;第三类是人
工智能应用问题,往往是细分领域的核心基础问题
或是应用实现过程中的技术问题,是前两类问题的
最终表现形式。这与上述分析的研究热词分布特征
相互印证,以神经网络(包括人工神经网络)为首
的研究热点得到了人工智能领域学者的高度关注。
图 16 2014—2019 年人工智能领域研究关键词共现图谱 3.2.3 前沿主题分析
百分位数指标作为一种相对指标,在实际应用
图 17 是根据关键词中心性展示的共现图谱, 中往往根据需求选择合适的百分位分数作为阈值,
方块的大小代表的是中心度,方块越大则表示关键 例如 ESI 的高被引论文和研究前沿都是基于各学科
词与其他关键词的关联越多。从图 17 中可以看出 论文引用数量前 1% 的阈值;崔宇红等[13]经实验,
算法(algorithm)、优化理论(optimization)、人工 设定主题显著性百分位数阈值为 99% 的主题为研究
神经网络(artificial neural network)是最具代表性的 前沿。本研究采用主题显著性百分位数阈值为 99%
关键共性内容,人工智能领域的多数问题都需要以 来分析人工智能领域前沿主题,其中排名前十的前
此为基础进行分析解决;其次为学习算法(learning 沿主题如表 6 所示(按发文量排序)。
表 6 2014—2019 年人工智能领域前十前沿主题及指标统计
序号 主题 文献量 / 篇 增长率 FWCI 主题显著度指数
1 convolution; neural networks; convolutional network 3 557 91.6% 2.42 99.989
2 decision making; fuzzy sets; linguistic term 1 644 -23.3% 3.07 99.901
3 recommender systems; filtration; rating matrix 1 633 38.2% 1.62 99.852
4 semantics; natural language processing systems; word representations 1 618 78.0% 2.22 99.580
5 data mining; social networking (online); opinion words 1 526 58.5% 1.85 99.827
刘龑龙等:基于文献计量学的人工智能领域研究现状及热点分析 47
表 6(续)
序号 主题 文献量 / 篇 增长率 FWCI 主题显著度指数
6 robots; robotics; uncanny valley 1 490 -28.8% 1.62 99.423
7 multi agent systems; control; containment control 1 184 80.5% 0.95 99.894
8 unmanned aerial vehicles (UAV); control; quadrotor unmanned 1 116 -4.0% 1.60 99.689
9 cameras; robotics; camera pose 1 109 -9.2% 2.77 99.723
10 robots; robotics; continuum robots 1 057 32.1% 2.05 99.693
(4)聚焦人工智能领域基础理论和关键共性技 05-16].https://p.widencdn.net/1ldn6j/ACAD_SV_EB_
SciValUsageandPatentGuide_WEB.
术的研究,尤其在人工智能领域的核心算法和基础
[7] 匡 登 辉 , 张 立 彬 . 顶 级 学 术 论 文 的 补 充 计 量 学 特 征 分 析 :
研究方面提升研究水平,把握人工智能发展前沿的 基 于“Nature” 周 刊 的 实 证 研 究[J]. 情 报 理 论 与 实 践 ,
选题、创新和突破;培养学科带头人,重视引进和 2019,42(2):80-86.
培养人才,进而提升我国人工智能领域的科研竞争 [8]ELSEVIER. Topic prominence in science[EB/OL].(2020-10-
25) [2020-05-16]. https://www.elsevier.com/solutions/scival/
力和学术影响力。
releases/topic-prominence-in-science.
[9]KLAVANS R, BOYACK K W. Research portfolio analysis and topic
参考文献: prominence[J].Journal of Informetrics,2017,11(4): 1158-1174.
[1]McCORDUCK P, MINSKY M, SELFRIDGE O, et al. History of [10]黄辛 .《中国新一代人工智能发展报告 2019》发布[N]. 中
artificial intelligence[C]//THE INTERNATIONAL JOINT 国科学报 ,2019-05-30(7).
CONFERENCES ON ARTIFICIAL INTELLIGENCE, INC. [11]SCIVAL SUPPORT CENTER. How are keyphrases calculated?
IJCAI'77: Proceedings of the 5th international joint conference on [EB/OL].(2020-10-25)[2020-05-23]. https://service.
Artificial intelligence: volume 2.San Francisco:Morgan Kaufmann elsevier.com/app/answers/detail/a_id/27763/supporthub/Scival/.
Publishers Inc., 1977. [12]陈超美 , 陈悦 , 侯剑华 , 等 . CiteSpace Ⅱ : 科学文献中新趋势
[2]张振刚 , 黄洁明 , 陈一华 . 基于专利计量的人工智能技术前沿识 与新动态的识别与可视化[J]. 情报学报 ,2009,28(3):401-421.
别及趋势分析[J]. 科技管理研究 ,2018,38(5):36-42. [13]崔宇红 , 王飒 , 高晓巍 , 等 . 基于全域微观模型的研究前沿主
[3]邹本涛 , 王曰芬 , 曹嘉君 , 等 . 人工智能研究前沿识别与分析 : 题探测和特征分析[J]. 图书情报工作 ,2018,62(15):75-82.
基于高产作者多属性综合研究视角[J]. 情报理论与实践 ,
2019,42(9):22-27. 作者简介:刘龑龙(1988—),女,通信作者,山东泰安人,博士,
[4]任利强 , 郭强 , 王海鹏 , 等 . 基于 CiteSpace 的人工智能文献大 主要研究方向为技术预测;史冬梅(1964—),女,黑龙江大庆人,
数据可视化分析[J]. 计算机系统应用 ,2018,27(6):20-28. 研究员,主要研究方向为科技发展战略与科技计划管理;刘进长
[5]ELSEVIER. Scopus content coverage guide[EB/OL]. (2020-03- (1964—),男,河北深县人,研究员,主要研究方向为科技管理
09)[2020-05-16].https://www.elsevier.com/__data/assets/pdf_ 与战略;唐莉(1977—),女,河南信阳人,教授,主要研究方向
file/0007/69451/Scopus_ContentCoverage_Guide_WEB.pdf. 为科技创新政策与科技评价;王金鹏(1989—),男,辽宁朝阳人,
[6]ELSEVIER. Quick guide to SciVal usage and patent 博士,主要研究方向为 5G 通信与人工智能。
metrics guidebook[EB/OL]. (2020-10-25)[2020-