Professional Documents
Culture Documents
基于 Altmetrics 的学术论文评价研究评述
摘 要: [目的 / 意义] 学术论文评价是科研管理和科学计量学关注的核心议题之一,以同行评议和文献计量为主
要研究方法,不仅存在主观性强、时滞性等问题,也难以对学术论文的社会影响力进行评估,而 Altmetrics 的诞生为上
述问题的解决提供了新的视角。 [方法 / 过程] 文章主要关注基于 Altmetrics 的学术论文评价研究问题,通过文献调研方
法对该领域的研究现状、进展及存在问题进行综述分析,具体内容包括: Altmetrics 数据源的选择、评价指标的设计、
评价策略和结果评估。[结果 / 结论] 综述发现,Altmetrics 对于学术论文评价具有一定的可用性,与传统评价方法呈显
著互补性,但仍存在数据源质量参差不齐、权威指标缺乏、与传统评价方法的融合力度不够,以及评价方法论和评价理
论研究较为薄弱等问题。
关键词: Altmetrics; 论文评价; 学术影响力; 社会影响力; 评价策略
DOI: 10. 16353 / j. cnki. 1000-7490. 2021. 09. 027
引用格式: 郭倩影,赵丹群 . 基于 Altmetrics 的学术论文评价研究评述 [J]. 情报理论与实践,2021,44 ( 9 ) :
190-197.
Abstract: [Purpose / significance] Evaluation of paper is one of the core issues of scientific management and scientomet-
rics. With peer review and bibliometrics as the main research methods,there are not only problems such as strong subjectivity and
time lag,but also difficulties in evaluating the social impact of paper. The birth of Altmetrics provides a new perspective to solve the
above problems. [Method / process] This paper focuses on the research of academic paper evaluation based on Altmetrics,and
summarizes the research status,progress and existing problems in this field through literature research method,including the selec-
tion of Altmetrics data sources,the design of evaluation indicators,evaluation strategies and the evaluation of results. [Result /
conclusion] It is found that Altmetrics has certain usability for academic paper evaluation,which is significantly complementary to
traditional evaluation methods. However,there are still some problems such as uneven quality of data sources,lack of authoritative
indicators,insufficient integration with traditional evaluation methods,and weak research on evaluation methodology and evaluation
theory.
Keywords: Altmetrics; paper evaluation; academic influence; social influence; evaluation strategy
作为科研活动最重要的产出与表现形式,学术论文的 也促使科研管理部门和研究人员逐渐将科研成果的评价视
发表及其评价研究始终是科研管理和科学计量学关注的核 角 ( 或议题) 从学术价值 ( 学术影响力) 层面拓展到了
心议题之一。长期以来,以同行评议为代表的定性评价和 更广泛的社会影响力层面。例如,2014 年启动的英国卓
以文献计量 ( 主要是引文分析) 为代表的量化评价,一 越研究框架就已将社会影响力评估纳入到了正式的研究评
[5]
直围绕着论文学术价值 ( 贡献) 或学术影响力等评价任 估中 。对此,传统的论文评价方法 ( 尤其是引文分析)
务而展开。两类方法既互有所长,也各有不足。前者主观 比较难以解决这个问题。
性强、费时费力,后者则较多受到评价指标创设及合理运 与此同时,伴随着 e-Science 的不断推进,越来越多
用、评价数据质量与时滞性等因素的影响。近年来,随着 的学术交流活动迁移到网络环境中,基于在线社交媒体数
[1]
开放存取 、开放引文[2-3] 、开放代码[4] 等一系列开放科 据的 Altmetrics 应运而生。相较于传统评价方法,Altmet-
学运动的兴起和推动,学术成果能否惠及普通民众、能否 rics 的问世将学术评价研究带入崭新的 2. 0 时代[6] 。短短
解决重大社会问题、能否满足公众的现实需求或自身关切 几年时间,除学术论文外,包含更多学术评价对象 ( 例如
等问题逐步引起社会各界关注。所有这些变化,不仅带动 软件代码、会 议 视 频、论 坛 发 帖、博 客 博 文 等) 的 Alt-
了社会公众对科学研究活动关注度与参与度的不断提升, metrics 研究 活 动 形 成 了 一 种 颇 有 声 势 的 潮 流——— “Alt-
Information studies: Theory & Application
Survey & Review Vol. 44 No. 9 ( Sep. 2021)
191
[17] [22]
学术用户,而 Twitter 则面向更广泛的用户 。 数据获取的不便,更多学者则重点关注特定机构 、学
[23] [24] [25]
2) 数据积累速度及稳定性方面。引文数据因其时滞 者 、学科 、国家 等范围内的论文在不同数据源的
性难以评估学术论文的短期学术影响力,而 Altmetrics 数 分布情况,结果发现除 Mendeley 外,其他数据源的覆盖
据无需同行评审,总体上更为迅速及时。但值得注意的 率均较低; 分学科观察发现,各数据源对于生命科学领域
是,不同 数 据 源 的 数 据 积 累 速 度 是 不 同 的,如 Reddit、 论文的覆盖率都远高于其他学科。
Twitter、News、Facebook、Google + 和 Blog 等 Altmetrics 数 此外,数据整合分析工具也存在着覆盖率问题,主要
据发布后短期积累非常快; 而政策文件、同行评议、问 表现为对原始数据源汇聚的完整性。学者研究表明,Alt-
答、维基百科、视频和 F1000Prime 的数据积累速度则相 metric. com 对博文、新闻和推文的覆盖率最高,PlumX 对
[18]
对较慢 ,其中政策文件的平均时滞甚至高于引文数据, Mendeley 读者数 据 的 覆 盖 率 最 高,而 Crossref Event Data
[19] [26]
长达 4. 5 年 。另外,数据的稳定性也影响着数据用于 则覆盖了更多的维基百科数据 。从国家、语言和主题
评估的可行性,已有研究对 Altmetrics 数据的稳定性持怀 等维度来看,Altmetric. com 在地理和语言上最具多样性,
疑态度,如对 Twitter 数据进行研究发现,受用户删除推 是博客覆盖率最高的平台,PlumX 收集了更多的新闻媒
文和用户账号注销等因素的影响,一定时间后其数据可能 体,尤其是美国地方报纸,而 Crossref Event Data 则汇集
[20] [27]
出现不可用问题 。 了大多数英文资源 。
3) 数据覆盖范围 ( 覆盖率) 方面。原始数据源和数
2 Altmerics 评价指标
据整合分析工具都存在覆盖率问题,对于待评价的学术论
文集,应尽可能选择对其覆盖率较高的数据源。对于原始 2. 1 指标设计使用
数据源而言,覆盖率过低则难以用来定量评估论文影响 2. 1. 1 原始指标 目前用于论文评价研究的 Altmetrics 指
力。对文献数据库或 Altmetrics 数据整合分析工具收录文 标,其设计和使用多与 Altmetrics 原始数据源直接相关,
献的大规模分析,是确定 Altmetrics 数据覆盖率的两种不 例如 Mendeley 读者数,推特 ( 或微博) 的发帖数、点赞
同方案。前者关注于文献数据库收录文献在不同 Altmet- 数、转发数及评论数,博客 ( 或新闻) 的发帖数,维基
rics 数据源上的提及率,如有学者分析了 2012—2018 年发 百科的网页数等。这类指标因为与原始数据源直接相关,
表 在 WoS 的 全 部 论 文 在 Mendeley、 Twitter、 Facebook、 不仅数量众多,计算方法简单,使用也十分广泛。单纯地
Wikipedia 等 12 个 Altmetrics 数据源上的分布情况,结果 对指标进行罗列,难以发挥其最大价值,因而学者对这类
发现,Mendeley 的覆盖率最高 ( 89. 30% ) ,其次是 Twitter 指标进行了类型划分,以期对这些指标进行整理归纳,以
[18]
( 34. 01% ) ,而其他数据源的覆盖率均低于 10% ; 后 便后续对不同类型指标赋予不同的权重,也为指标的进一
者则专注于被 Altmetrics 数据源提及的论文在不同 Altmet- 步整合提供了基础。当前对 Altmetrics 指标的类型划分依
rics 数据源上的分布,如学者对从 Altmetric. com 下载的全 据主要是学术成果影响力的产生路径即学术交流过程,如
[28]
部论文 在 各 媒 介 的 分 布 情 况 进 行 统 计 分 析,发 现 其 在 余厚强等基于此将其分为传播、获取和利用三类 ,和
Twitter 和 Facebook 被提及的比例为 76. 5% 和 23. 7% ,而 学术交流方式,如赵蓉英等将其分为使用型、捕获型、提
[21] [29]
在其他数据源被提及的比例均少于 20% 。此外,由于 及型、社交媒介型和引文型指标 5 类 。
Information studies: Theory & Application
Survey & Review Vol. 44 No. 9 ( Sep. 2021)
193
刘艳民 AAS, Facebook, Blogs, Twit- WoS 被引频次 Pearson 截至 2016. 4. 25,Altmetric. com 所有 < 0. 2
( 2017) [21] ter,Google + ,News outlets 期刊影响因子 相关分析 数据 < 0. 2
Eabhann M. 2014、2015 年 JCR 泌尿学和肾脏学
Spearman 0. 35
O’Connor AAS WoS 被引频次 top10 期刊被引频次 top5 论文
相关分析
( 2017) [54] 2014、2015 年 AAS top50 论文 - 0. 20
Mendeley 0. 614
CiteULike 0. 215
余厚强 Blogs, News, F1000, Twitter, Spearman 2011. 7—2015. 11, Altmetric. com 所
Facebook,Wikipedia,Google + , Scopus 被引频次
( 2017) [55] 相关分析 有数据
Reddit, Policy, Video, Weibo, < 0. 20
LinkedIn, Q & A, Pinterest,
Connotea,peer review
3. 2 融合分析 据的可用性来选择指标,进而通过因子分析或主成分分析
[8]
有鉴于 Altmetrics 的 自 身 优 势 及 其 与 传 统 评 价 方 法 确定评价维度 。其他研究也多以引文指标和来自 Alt-
( 维度) 的显著互补性,将 Altmetrics 作为一个新的评价 metrics 数据整合分析工具的评价指标作为候选指标,通过
维度,融入到包括同行评议、引文分析等在内的既有评价 指标覆盖率和指标间相关性进行指标筛选,然后利用主成
框架中,正在推进学术论文评价研究的深化发展。 分分析得到主成分因子并构建综合评价模型,不同研究得
[12-13,
58]
文献调研发现,当前融合了 Altmetrics 指标的论文综 到的主成分因子不完全相同 。
合评价体系构建研究主要有两种,一种是自上而下,基于 近来,学者在构建评价体系时还考虑了论文发表时间
论文影响力产生机制确定评价维度,进而选择合适的指标 的影响,给不同的发文时间赋予不同的权重。例如,刘运
并加以融合。如程爱娟将论文影响力分为被感知程度、社 梅等根据 Altmetrics 不同指标随时间变化的不同表现,提
会影响力和学术影响力三个维度,并以 Altmetrics 指标作 出时间因素视角下的月均使用量 Ut ( 使用指标) 、首月讨
[56]
为前两个维度的测度指标 。王贤文等则提出应该构建 论量 T1 ( 讨论指标) 等指标,并结合引文指标构建论文
[59]
包括论文学术影响力、社会影响力、长期影响力和短期影 影响力综合评价体系 。王菲菲等使用灰色关联分析和
响力等多个维度的连续、动态和复合的单篇论文评价体 熵权法来计算不同时间窗口下的指标权重,同时将传统文
系,并以 Altmetrics 指标作为社会影响力和短期影响力的 献计量指标 ( 被引频次) 及 Altmetrics 指标进行融合,构
[57]
测度指标 。另一种是自下而上,基于评价对象各种数 建双重赋权动态综合评价模型,对不同年龄的论文综合影
Information studies: Theory & Application
Survey & Review Vol. 44 No. 9 ( Sep. 2021)
195
[60]
响力进行评价 。 评价理论研究比较薄弱。Altmetrics 的问世将学术评价研
3. 3 结果评估 究带入 2. 0 时代,对学术评价理论的完善意义重大。但其
对任何评价工作而言,评价结果的形成以及对结果的 自身研究大多为实证性分析,不论是方法层面还是理论层
评估分析都是不容忽视的重要步骤,其中结果评估部分具 面,都有待加强或提升。例如针对评价结果,如何进行兼
体又包括自我解读、同行验证以及实际应用等。目前,对 具科学性和建构性的分析解读和有效验证,目前都多有忽
于大多数基于 Altmetrics 的论文评价研究来说,对结果的 视或较为缺乏。这对于评价方法论的完善十分不利,进而
自我解读普遍都得到了重视,但对结果有效性的验证分 影响到或阻碍了理论认知上的不断深化。□
析,则相对缺少或重视不够,尤其采用同行验证方式的比 参考文献
较少见。 [1 ] Budapest open access initiative [EB / OL]. [2020-11-25].
多数研究采用实证方法对评价结果进行了一些验证分 https: / / www. budapestopenaccessinitiative. org / .
文) 的准确性,多利用机器学习算法,基于 Precison-Re- [3 ] I4OC: invitation for open citations [EB / OL]. [2020-11-
[51,
61] 25]. https: / / i4oc. org / #about.
call 进行评估 ; 后者则关注利用 Altmetrics 指标与其
[4 ] Making source code open and reusable [EB / OL]. [2020-11-
他论文评价方法 ( 论文被引频次、h 指数等) 对论文排序
[36] 25]. https: / / www. gov. uk / service-manual / technology / making-
结果的相关性或一致性,利用图表相关分析 、肯德尔
[12-13] [62] source-code-open-and-reusable.
和谐系数 和平均绝对百分比误差 ( MAPE) 等方法
[5 ] REF 2014: research excellence framework 2014 [EB / OL].
进行评估。
[2020-11-25]. https: / / www. ref. ac. uk /2014 / media / ref / con-
[43] KARMAKAR M,BANSHAL S K,SINGH V K. Does presence 系研究 [J]. 情报理论与实践,2018,41 ( 7) : 60-64.
of social media plugins in a journal website result in higher so- [54] O’CONNOR E M,NASON G J,O’Kelly F,et al. News-
cial media attention of its research publications? [J]. Sciento- worthiness vs scientific impact: are the most highly cited urolo-
metrics,2020,124 ( 3) : 2103-2143. gy papers the most widely disseminated in the media? [J].
[44] 赵蓉英,余波 . Altmetrics Top100 论文的合作模式及其影响 BJU International,2017,120 ( 3) : 441-454.
力因素分析 [J]. 情报科学,2020,38 ( 4) : 3-8. [55] 余厚强 . 替代计量指标与引文量相关性的大规模跨学科研
[45] THELWALL M,HAUSTEIN S,RE V L,et al. Do Altmetrics 究———数值类型、指标种类与用户类别的影响 [J]. 情报
work? Twitter and ten other social web services [J]. PLoS 学报,2017,36 ( 6) : 606-617.
One,2013,8 ( 5) . [56] 程爱娟 . 基于 Altmetrics 的单篇论文影响力评价研究 [D].
empirical test of the convergent validity of altmetrics based on [59] 刘运梅,李长玲,杜德慧 . 网络环境下论文影响力综合评
data from the UK research excellence framework ( REF) [J]. 价体系构建———基于时间因素视角 [J]. 情报资料工作,
[49] BORNMANN L. Validity of altmetrics data for measuring societal [60] 王菲菲,弋新月,贾晨冉,等 . Altmetrics 视角下科技文献
impact: a study using data from Altmetric and F1000Prime 学术影响力动态评价体系构建与实证研究 [J]. 情报理论
[22] JIANG F,LIU Y,LUAN H,et al. Microblog sentiment analy- to domain-specific social media texts [J]. Decision Support
sis with emoticon space model [J]. Journal of Computer Sci- Systems,2017,94: 65-76.