You are on page 1of 10

·新冠疫情研究:信息资源与数据管理视角·

突发公共卫生事件微博舆情主题挖掘与演化分析
曹树金 岳文玉
(中山大学信息管理学院,广州,510006)

[摘 要] 探索突发公共卫生事件微博舆情传播周期中各阶段的热点主题,勾勒舆情事件主题演
化的时序发展趋势,为舆情决策与分析提供科学依据。 以近期发生的影响巨大的一起重大突发公
共卫生事件为例,结合生命周期理论、TF
-IDF 特 征 词-权 值 模 型 以 及 潜 在 狄 利 克 雷 模 型 方 法,将 时
间维度融入微博文本分析,进行包括时间序列的主 题 挖 掘 工 作,挖 掘 隐 含 的 主 题 信 息 和 舆 情 演 化
规律,并提出相应的舆情管控策略。 采用的舆情演化分析方法能够揭示突发公共卫生事件微博舆
情传播周期中各阶段主题的讨论内容和时序发展趋势,研究对于优化微博平台民意收集作用和辅
助相关管理部门在处理类似事件时,有效引导与控制网络舆情提供了一定的理论基础支撑和科学
决策支持。

[关键词] 突发公共卫生事件 网络舆情 主题分析 演化分析 舆情分析 微博文本挖掘

[中图分类号] G255.
76;G254 [文献标识码] A [文章编号] 2095
-2171(2020)06
-0028
-10
DOI:10.
13365/j.
i
jrm.
2020.
06.
028

Topic Mining and Evolut


ion Analysis of Publ
ic Opinion on Microblog of Publ
ic
HealthEmergencies
CaoShu
jin Yue Wenyu
(Schoo
lofI
nfo
rma
ti t,Su
onManagemen nYa
t-senUn
ive
rsi
ty, Guangz
hou, 510006)

[Abst
ract] Th
ispaperistoexplorethehottop
icsineachstageofthepubl
icopini
oncommunicat
ioncycle
ofpubli
cheal
themergencymicrob
log, ou
tl
inethetimesequencedevelopmen
ttrendoft
hetopi
cevo lu
tionof
publi
cop i
nionevens, andprov
t idescien
ti
fi
cbasisfordeci
sion
-mak i
ngandana lys
iso fpublicsent
iment.Tak-
ingarecentpubli
chea l
themergencyasanexamp l ,
e combini
ngthel i
fecyclet 、
heory TF-IDF modelandLa-
tentDir
ichl
etAll
ocation (LDA) met
hod,thetimedimensi
onisincorporatedi
ntomicro-blogtextanal
ysis.The
top
icmin i
ngworki
ncl
udest
imeseriesminingoft
heh iddentopi
cinformat
ionandtheevol
uti
onruleofpub
lic
opi
ni ,
on andbasedontheevo
lut
iontrendofeachs ,
tage t hecor
respondi
ngpubli
copini
on managemen
tand
con
tro
lst
rategyi
sproposed.
Theproposedpub
licop
inionevo
lut
ionana
lys
ismet
hodcanrevea
lthed
iscuss
ion
con
ten
tandt
imesequencedevel
opmen
ttrendo
feachs
tagei
nthepub
licop
ini
oncommun
icat
ioncyc
le.
The
researchprov
idesat
heoret
ica
lbas
isandsc
ien
ti
fi
cdec
isionsuppor
tforopt
imi
zingt
hepub
licop
ini
onco
llec-

[作者简介] 曹树金,教授,博士生导师,研究方向为信息组织与信 息 检 索、用 户 信 息 行 为、网 络 信 息 管 理 等,Ema


il:ca
-
os
j@ma
il.
sys
u.edu.
cn;岳文玉,博士生,研究方向为网络信息管理,Ema
il:yuewy3@ma
il2.
sys
u.edu.
cn。

J].信息资源管理 学 报,
本文引用格式:曹树金,岳文玉 .突发公共卫生事件微博舆情主题挖掘与演化分析[ 2020,
10(
6):
28
-37.

28
t
ionf
unc
tiono
fmi
crob
logpl
atf
orm andass
ist
ingrel
evan
tmanagemen
tdepar
tmen
tstoef
fec
tivel
ygu
ideand
con
tro
lnetworkpubl
icop
ini
onwhendea
lingwi
ths
imi
lareven
ts.

[Keywords] Publi
chealthemergenc
ies; I
nternetpub
licopi
nion; Themat
icana
lys
is; Evo
lut
ionaryana
ly-
s
is; Pub
licop
ini
onanal
yss; Mi
i crobl
ogtextmi ni
ng

制网络舆情,提供了一定的 理 论 基 础 支 撑 和 科
1 引言
学决策支持。
突发公共卫生事件具有控制难度大、爆发
性强以及应对周期长的特 点,不 仅 影 响 公 众 的 2 相关研究
身心健康,也给政府相关部 门 的 防 控 工 作 带 来 2.
1 突发事件生命周期研究
挑战。 社交媒 体 技 术 的 快 速 发 展 为 突 发 公 共 由于不同学者的研究角度不同,突发事件
卫生事件网络舆情产生、发 酵、升 温、传 播 与 爆 生命周 期 的 阶 段 划 分 具 有 不 确 定 性, 有 四 阶
发提供了环境,以微博为代 表 的 新 媒 体 已 经 成 段、六 阶 段 以 及 八 阶 段 等 多 种 划 分 模 式。
为公众 发 表 观 点 的 重 要 渠 道。 2019 年 底, 一 F
i
[3]
nk 对于突发事件的传播提出了经典的四阶
起重大 突 发 公 共 卫 生 事 件 在 我 国 爆 发,2020 段生命周期模式,包括潜伏 期、爆 发 期、蔓 延 期
年 1 月 30 日, 世 界 卫 生 组 织 宣 布 将 该 事 件 列 和恢复期;贾亚敏等 [4] 构建 了 城 市 突 发 事 件 网
为“国际关注的突发公 共 卫 生 事 件” [1]
,对 公 民
络舆情传播的生命周期模 型,并 将 其 划 分 为 起
生活和社会经济发展带来 巨 大 影 响,引 发 公 众
始阶段、爆发阶段、衰退阶 段 及 平 息 阶 段,其 研
在微博平 台 上 的 激 烈 讨 论。 公 众 针 对 当 前 事
究反应了各个阶段的量 化 特 征;廖 海 涵 等 [5] 将
件发表意见、 情 绪 和 态 度 的 相 关 信 息, 迅 速 形
微博舆情传 播 周 期 划 分 为 萌 芽 期、 成 长 期、 衰
成舆情通过微博快速传 播。 一 方 面,这 些 大 量
退期以及平稳期;李纲等 [6] 将 网 络 舆 情 的 发 展
信息为相关 管 理 部 门 提 供 了 宝 贵 的 公 众 意 见
演化 过 程 分 为 潜 伏、成 长、蔓 延、爆 发、衰 退 和
及态度来源; 另 一 方 面, 由 于 新 闻 素 材 来 源 广
死亡六个阶段;吴晓娟 [7] 依 据 目 标 话 题 传 播 趋
泛,信息不对称导致的谣言 和 公 众 情 绪 波 动 不
势的多峰特征,将舆情演化 周 期 划 分 成 八 个 阶
断发酵,舆情 爆 发 和 传 播 难 以 控 制, 增 加 了 社
段。 上述研究多利用生命 周 期 理 论 为 指 导,对
会不稳定的风险要素。
突发事件网络舆情的演化 模 式 进 行 分 析,更 细
2020 年 2 月 10 日,习 近 平 总 书 记 在 北 京
致、深入 地 挖 掘 了 舆 情 事 件 传 播 中 的 有 效 信
调研指 导 该 事 件 防 控 工 作 视 频 会 议 中, 作 出
息。 本文以生命周期理论 为 基 础,依 据 突 发 事
“要加强 舆 论 引 导 工 作” 的 重 要 指 示 [2] 。 政 府
件网络舆情 生 命 周 期 曲 线 的 特 点 对 舆 情 事 件
相关部门应 及 时 了 解 舆 情 发 展 状 况 和 公 民 态
进行划分。
度,根据处置 进 展 动 态 发 布 信 息, 促 进 信 息 通
畅和民心凝聚。 有效的舆 情 管 控,需 要 对 整 个 2.
2 微博话题发现研究

事件进行 全 面 了 解 并 把 握 舆 情 演 化 规 律。 本 随着微博的普及,微博话题发现及演化研

文以该事件 为 例, 基 于 大 量 相 关 微 博 文 本, 结 究逐渐受 到 学 者 关 注。 主 题 模 型 是 当 前 话 题

合生命周 期 理 论、TF
-IDF 模 型 和 LDA 模 型 方 发现研究 的 重 要 方 面。 国 外 学 者 对 主 题 模 型

法,将时间维 度 融 入 微 博 文 本 分 析, 结 合 特 征 领域的研究相 对 较 早,Sa


lton 等 提 出 了 空 间 向
词权重辅助进行主题识别 工 作,挖 掘 隐 含 的 主 量 模 型 ( Vec
to l) 和 TF
r Space Mode
[8]
-IDF
题信息和 舆 情 演 化 规 律。 针 对 舆 情 事 件 的 演 (Te
rm F
requency
-Inve
rse Doc
umen
tFr
e-quen
-
cy)特征 词-权 值 模 型 ;Dee
[9]
化特征进行 对 策 性 研 究, 形 成 从 采 集 与 处 理、 rwes
ter等 提 出 了
挖掘与分析,到策略支持的 全 过 程 舆 情 分 析 框 潜在语义分析模型 (La
ten
tSeman
ticAna
lys
is,
LSA) ,引 入 “ 语 义 ” 维 度, 对 TF
[10]
架,对于优化微博平台民意 收 集 作 用 和 辅 助 相 -IDF 矩 阵 实
关管理部门 在 处 理 类 似 事 件 时 有 效 引 导 与 控 现 了 降 维;Ho
fman
n提出了基于概率统计的

29
PLSA(P
robab
il
ist
ic La
ten
tSeman
tic Ana
lys
is) 发展演变复 杂, 具 有 高 危 性 和 不 确 定 性, 针 对
模型 [11]
;B
lei 等 在 PLSA 的 基 础 上, 引 入 舆情快速、准 确 地 制 定 相 应 决 策, 还 需 依 赖 情
D
iri
chl
et先验分布,提 出 了 隐 含 狄 利 克 雷 模 型 报这一关键要素 [20] 。 因此,本文试图解决以下
(La
ten
tDi
rich
letA
lloca
tion, LDA) 。 在 国
[12]
问题,一方面,以生命周期理论为指导,结合 TF
-
内,越来 越 多 的 学 者 参 与 推 动 微 博 话 题 的 研 I
DF 模型和 LDA 建模,构建舆情分析框架,以近
[13]
究,陈磊 等 在 LDA 的 基 础 上 融 入 Wo
rd2vec 期发生的重大 突 发 公 共 卫 生 事 件 为 例,通 过 定
[14]
方法,提高特征 分 类 的 效 果;伊 秀 娟 提出一 量分析和可视 化 方 法,洞 察 舆 情 事 件 传 播 周 期
LDA(T
种 基 于 标 题 加 权 的 TW- itl
e-We
igh
ted 中不同阶段的 舆 情 热 点 和 主 题 演 进 过 程,为 舆
LDA)主题模型,通 过 对 特 征 词 加 权,提 高 了 对 情分析中的观点挖掘和主题分析研究提供一定
[15]
主题描述 的 准 确 性; 李 海 磊 等 将词对向量 的方法参考;另一方面,针对舆情事件的演化特
空间模型(B
itrm-VSM)和 LDA 模型进行结合,
e 征进行对策性 研 究,为 相 关 管 理 部 门 在 处 理 类
解决传统的 话 题 检 测 方 法 在 微 博 短 文 本 上 存 似事件舆情管控时提供科学的决策依据。
在的缺陷。
3 研究设计
2.
3 突发事件微博舆情管理研究
3.
1 研究框架
国外研究 主 要 集 中 在 社 交 媒 体 舆 情 状 态
本研究以 近 期 发 生 的 重 大 突 发 公 共 卫 生
监控 以 及 舆 情 分 析 处 理 技 术 等 方 面。 例 如,
事件为例,选用新浪微博平 台 中 该 事 件 相 关 微
[16]
Kee
lan 等 通过分析 博 文 的 特 征 以 及 对 博 主
博的数据 构 建 实 验 语 料 库, 基 于 TF
-IDF 模 型
的论点类型进行分类,了解 公 众 对 疫 苗 接 种 的
和 LDA 模型 追 踪 微 博 舆 情 事 件 传 播 内 容, 结
看法和态度,认为关注公众 对 公 共 事 件 的 态 度
合生命周期理论,挖掘舆情 事 件 传 播 周 期 中 不
以及利用新 媒 体 技 术 引 导 公 众 舆 论 是 政 府 应
同阶段的舆情热点和主题 演 进 过 程,其 总 体 研
对舆情的有效措 施;Ma 等 [17] 介 绍 了 重 大 突 发
究框架如图 1 所 示。 首 先 爬 取 相 关 热 门 微 博
事件中网络舆情信息的获 取 方 法,绘 制 舆 情 传
文本及 评 论 数 据, 对 采 集 到 的 文 本 进 行 预 处
播规律曲线,并从信息发布 和 动 力 来 源 的 角 度
理,具体操作 包 括 中 文 分 词、 删 除 停 用 词 以 及
提出应对 策 略。 国 内 的 研 究 范 围 主 要 集 中 在
加入用户自 定 义 词 典 等; 其 次, 结 合 生 命 周 期
突发事件网络舆情管理、监 测 以 及 舆 情 引 导 的
理论和舆情发展反复性的 特 点,对 舆 情 传 播 周
应急决策支持 等 方 面。 刘 继 等 [18] 构 建 了 网 络
期的不同阶段 进 行 划 分;再 次,基 于 TF
-IDF 模
舆情基本特征挖掘体系,将 机 器 的 定 量 计 算 和
型对各周 期 阶 段 每 个 文 档 的 每 个 词 计 算 TF
-
决策者的定性分析相结合,构 建 舆 情 智 能 监 测
I
DF 权值,并对采 集 到 的 微 博 文 本 语 料 库 进 行
机制;姚乐 野 等 [19] 指 出 了 突 发 事 件 应 急 管 理
LDA 建模,结 合 词 汇 的 TF
-IDF 权 值 对 主 题 下
实践中的情报工作存在的 不 足,探 讨 了 情 报 工
的特征 词 进 行 筛 选, 以 辅 助 各 主 题 内 容 的 识
作如何反映 事 件 演 化 过 程 以 及 为 应 急 管 理 流
别;最 后, 基 于 LDA 模 型 输 出 的 概 率 分 布 文
程提供支撑等问题。
件,进行热点主题挖掘和主题强度演化分析。
综上,通过梳理相关研究领域的发展动态
可以发现,一 方 面, 在 微 博 话 题 发 现 的 相 关 研
究中,学者 多 采 用 LDA 模 型 进 行 微 博 话 题 的
挖掘研究,虽在一定程度上 提 高 了 话 题 发 现 的
准确性,但未能很好地解决 主 题 中 出 现 的 高 概
率无效词对于主题可解释 性 的 影 响 问 题;另 一
方面,对网络舆情的分析多 集 中 于 意 见 的 挖 掘
分析,而对于事件主题在整 个 生 命 周 期 中 强 度
变化的可视化揭示相对较 少,对 主 题 内 容 演 化 图 1 微博舆情演化分析框架
规律的揭 示 探 索 不 足。 突 发 公 共 卫 生 事 件 的

30
3.
2 研究方法与步骤 条句子级别的短文本,且本 文 采 集 到 的 每 条 微
3.
2.1 突发公共卫生事件 微 博 传 播 的 生 命 周 博平均文本长度为 130。 因 此,可 以 将 LDA 模
期划分 型运用于本文的主题挖掘,在 文 档 语 义 层 面 实
从以往的 研 究 来 看, 由 于 研 究 视 角 不 同, 现海量 热 门 微 博 文 本 基 于 主 题 的 文 本 建 模。
突发公共事 件 网 络 舆 情 发 展 阶 段 划 分 具 有 不 但由于主题 中 仍 然 存 在 一 些 无 效 词 影 响 主 题
确定性,为了 准 确 表 达 舆 情 发 展 规 律, 结 合 生 的表意性,因此,本 文 引 入 TF
-IDF 特 征 词 权 值
命周期理论和舆情发展反 复 性 的 特 点,初 步 采 模型辅助各阶段主题内容的识别。
[21]
用贾亚敏 等 划 分 的 舆 情 传 播 四 阶 段 发 现, TF
-IDF 是一种 文 本 分 类 中 计 算 特 征 权 重
衰退阶段不 能 体 现 网 络 舆 情 传 播 信 息 数 量 变 的方法,主要用于反映词在 语 料 库 所 有 文 本 中
化的波动性,同时平息阶段 不 能 体 现 舆 情 具 有 的重要 性。 TF 表 示 词 频, 统 计 文 本 中 每 个 词
的长尾效应,故将这两个阶 段 分 别 命 名 为 波 动 出现的频率,I
DF 表示逆文本频率,评价每个词
阶段和长尾阶段。 在此基 础 上,将 突 发 公 共 卫 对于语料 库 的 普 遍 性,TF 值 和 I
DF 值 相 乘 得
生事件微博传播的生命周 期 划 分 为 起 始 阶 段、 到 TF
-IDF 值。 具有较 高 词 频 和 较 低 逆 文 本 频
爆发阶段、波动阶段和长尾阶段。 率的词在文档中具有重要 地 位,可 作 为 该 文 档
(1)起始 阶 段, 是 指 从 事 件 舆 情 发 生 源 头 的代表标签 [26] 。 本文利用 TF
-IDF 统 计 出 各 阶
到舆 情 信 息 快 速 传 播 爆 发 之 前 的 这 个 阶 段词汇权 值 排 序, 结 合 LDA 模 型 抽 取 各 阶 段
段 [22]
。 微博 舆 情 发 文 量 和 评 论 转 发 数 量 较 主题特征词, 将 二 者 结 果 进 行 对 照 分 析, 减 少
少,话题种类少,爆发区域 有 限,难 以 引 起 相 关 无效高频词对主题分析的 影 响,辅 助 挖 掘 隐 含
管理部门的重点关注。 的主题信息。
(2)爆发 阶 段, 舆 情 信 息 的 发 布 数 量 呈 现 微博文本 信 息 中 隐 含 着 网 民 对 舆 情 事 件
指数级增长,在短时间内维 持 较 高 水 平 并 达 到 的观点态度和情感倾向,同 时 由 于 网 民 的 多 元
最高点的这段时间。 公众 关 注 度 急 剧 上 升,舆 性,在同一 阶 段 内 会 出 现 多 个 主 题。 因 此, 依
情话题数量激增,微博发布 与 评 论 转 发 数 量 随 据微博数 据 的 特 征, 本 文 基 于 LDA 模 型 构 建
时间呈现激增的曲线形式。 由时间、微博文本两因素融 合 下 的 主 题 挖 掘 模
(3)波动阶 段,是 组 织 强 烈 震 荡 的 时 期,持 型,结合 TF
-IDF 权值 模 型 的 分 析 结 果,挖 掘 舆
续时间 较 长 [23]
。 微博发布与评论转发数量呈 情发展各阶段的潜在主题。
现下降趋势,但 由 于 信 息 渠 道 的 多 元 和 不 完 全 3.
2.3 突发公共卫生事件 微 博 信 息 主 题 强 度
可控,致使不断 出 现 与 突 发 公 共 卫 生 事 件 相 关 演化分析
的新议题,引起舆情事件的传播不断出现反复。 为了发现 突 发 公 共 卫 生 事 件 微 博 舆 情 传
(4)长尾阶段,在经过 波 动 期 之 后,舆 情 事 播各阶段的主题演化过程,本 文 从 事 件 演 化 的
件传播量维持在相对较低 的 水 平,但 由 于 网 民 整个生命周期中提取共性 主 题,具 体 分 析 主 题
的多元化和利益诉求不同,仍 有 部 分 组 织 或 个 强度演化 特 征。 在 LDA 建 模 中, 主 题 强 度 相
人对事件进行持续的关注,对 其 讨 论 不 会 快 速 较于文本数 量 等 可 直 接 观 察 到 的 信 息 来 说 是
终止,仍会存在一定的消弭期。 抽象变量。 通 过 LDA 模 型 的 训 练 结 果, 得 出
3.
2.2 突发公共卫生事件微博信息的主题发现 各主题在每条微博文本下 的 概 率 分 布,可 作 为
LDA 模型的本质是基于“文档-主题-词”的 判断微博文本 讨 论 主 题 的 衡 量 标 准 [27] 。 通 过
三层贝叶斯概率模型,是可 实 现 文 本 聚 类 的 主 LDA 模型 生 成 文 档 主 题 隶 属 概 率θ d,k,θ d,k代
题生成模 型 [24]
,具 有 高 效 的 抽 样 推 理 算 法 和 表第 d 个 文 档 中 主 题k 的 概 率。 一 个 主 题 在
模型泛化能力。 但 由 于 LDA 模 型 不 适 合 处 理 不同文档中 的 主 题 隶 属 概 率 总 和 相 较 于 其 他
平 均 文 本 长 度 在 100 以 下 的 短 文 本 [25]
,因 此 主题越高,则表明其强度 越 高。 主 题 强 度 的 计
本文的检索 策 略 是 对 事 件 相 关 的 热 门 微 博 进 算方法为 [28] : 计 算 某 一 主 题 在 所 有 文 档 中 主
行采集,热门 微 博 信 息 质 量 较 高, 较 少 出 现 单 题隶属概率的平均值。 主 题 Tk 在 某 一 时 间 段

31
的强度可表示为: 微博数据进行 文 本 预 处 理。 采 用 I
CTCLAS 分

Hk =
∑ θ ,
d∈D d k
词工具,对微 博 文 本 进 行 汉 语 分 词 处 理, 并 在

|D | 用户自定 义 词 典 中 加 入 该 事 件 相 关 术 语。 将

|D|为文档集合 D 中 的 文 档 数 量,d 表 示 “全文”“收起”等无实际意 义 的 词 作 为 停 用 词,


文档集合中的 一 篇 文 档,θ d,k表 示 主 题 T k出 进行过滤 处 理。 数 据 预 处 理 需 要 持 续 重 复 进
现在文档 中 的 主 题 隶 属 概 率。 主 题 强 度 的 演 行,依据模型 输 入 需 求, 需 对 用 户 自 定 义 词 典
化分析即计算各主题在不 同 时 间 段 的 强 度 值, 进行不断扩充,直至得到满意的处理结果。
来反映主题强度演化情况。 4.
2 事件相关微博传播的生命周期划分
通过对样 本 微 博 评 论 与 转 发 总 数 的 统 计
4 实证分析
分析,得到微博相关信息在 时 间 序 列 上 的 分 布
4.
1 数据采集与预处理
特征,如 图 2 所 示。 需 要 说 明 的 是, 《 人 民 日
本研究选 用 新 浪 微 博 平 台 数 据 作 为 数 据
报》在 2020 年 2 月 5 日 15:37 的 一 条 关 于 征
来源,2019 年 12 月 29 日 [29] 湖 北 省 武 汉 市 对
集求 助 者 信 息 的 博 文, 评 论 和 转 发 总 量 为
于该事件聚集病例进行首 次 报 告,通 过 搜 索 相
15190056。 由于人 民 日 报 是 服 务 于 政 府 的 中
关热门微博发 现,第 一 条 微 博 源 于 2019 年 12
央媒体,这条微博属于政府 借 助 网 络 平 台 征 集
月 31 日。 本文以该突发公 共 卫 生 事 件 疾 病 名
信息,不属于 公 众 自 发 讨 论 的 舆 论 热 点 信 息,
称的 关 键 词 组 合 的 方 法 采 集 从 2019 年 12 月
参考价值 有 限。 而 且 由 于 该 条 微 博 数 据 量 过
31 日至 2020 年 4 月 4 日时间段内的热门微博
大,易导致结 果 失 真, 影 响 后 期 的 舆 情 演 化 分
及评论数据。 2020 年 1 月 9 日,通过病原学鉴
析,故该数据不纳入本研究当中。
定初步确定该传染性疾病 的 名 称,对 在 此 之 前
根据图 中 评 论 和 转 发 数 量 的 变 化 情 况 发
出现的不明 原 因 呼 吸 道 传 染 性 疾 病 的 相 关 微
现,目标话题的 传 播 趋 势 为 峰 值 分 布 无 规 律 的
博也纳入语 料 库, 以 保 证 语 料 来 源 全 面 准 确。
多峰特征,且 波 动 较 剧 烈。 为 了 准 确 表 示 舆 情
因此,人工清 洗 原 始 数 据, 去 重 并 剔 除 与 事 件
发展规律,结合舆情发展反复性的特点,将舆情
不相关的微 博 文 本、 图 片 以 及 链 接 等 数 据, 共
阶段划分为起始阶段(2019 年 12 月 31 至 2020
采集 39142 条微博数据,微博数据集包括博主
年 1 月 17 日)、爆发阶段(2020 年 1 月 18 日 至
D、微博文本、博文 链 接 以 及 29634282 条 评 论
I
2020 年 1 月 21 日)、波 动 阶 段(2020 年 1 月 22
数和转发数。
至 2020 年 2 月 10 日)和长尾阶段(2020 年 2 月
为提高实验结果的准确性,对爬取的相关
11 日至 2020 年 4 月 4 日)共四个阶段。

图 2 该舆情事件每日评论转发量

32
4.
3 事件相关微博的文本分析 采用 LDA 模 型 方 法 探 索 该 事 件 微 博 舆 情
本节首先 基 于 TF
-IDF 模 型 对 各 周 期 阶 段 的主题特征,进行包括 时 间 序 列 的 主 题 挖 掘 工
每个文档的每个词计算 TF
-IDF 权值,得出各周 作。 在试验阶段,本研究将主题设 置 为 15—22
期阶段的热词排序,其次采用 LDA 模型挖 掘 舆 类,对每一类中词的 隶 属 概 率 进 行 分 析。 研 究
情事件主题特征,并结合词汇的 TF
-IDF 权值对 发现,将 主 题 分 为 15—19 类 时,各 类 中 的 词 项
主题下的特征词进行 筛 选,以 辅 助 识 别 各 周 期 隶属概率逐 渐 上 升, 但 主 题 间 区 分 度 较 弱, 在
阶段热点主题信息,最 后 揭 示 在 生 命 周 期 各 阶 分为 20 类 主 题 时 输 出 的 实 验 结 果 较 好, 在 分
段微博舆情的热点主题分布。 为 21 类 时 词 项 的 分 布 概 率 下 降。 因 此, 将 主
运用 TF
-IDF 特征词-权值模 型 提 取 出 微 博 题 数目设置 T =20,超参数设置为α =0.
01,β
数据中各传播周期对 应 的 热 词,表 1 是 统 计 结 05,迭代 1000 次,抽 取 各 主 题 下 概 率 最 高
=0.
果的一部分,其中选取了各周期阶段排 名 前 10 的 前 30 个术语,利用 G
ibbsSamp
ling 进行参数
的词语。 估计和推断。
表 1 TF
-IDF 结果示例 为了更 准 确 地 挖 掘 该 舆 情 事 件 各 阶 段 的
起始阶段 爆发阶段 波动阶段 长尾阶段 主题内容,结合 TF
-IDF 模型统计出的各传播周
武汉市 钟南山 疫情 治愈 期对应的特征词权重,筛 选 掉 主 题 下 一 些 权 重
不明原因 确诊 确诊 病例
低且无效 的 高 频 特 征 词, 例 如 “ 超 过 ” “ 人 数 ”
重症 武汉 肺炎 肺炎
肺炎 病例 钟南山 出院 “取消”等,在一定程度 上 减 少 无 效 高 频 词 对 主
治愈 人传人 冠状病毒 防控 题分析的影响,增强 主 题 的 可 解 释 性。 选 取 起
疫情 治愈 防控 输入
始阶段、爆发阶段、波 动 阶 段、长 尾 阶 段 出 现 频
诊断 国家 治愈 国家
治疗 非典 医院 意大利 次占比均值较高的前 四 个 主 题 进 行 分 析,结 合
通报 定点 医疗队 发布会 特征词权重择优选取 概 率 较 高 的 10 项 特 征 词
判定 防控 李文亮 通报
进行展示,如表 2 所示。

表 2 事件发展不同阶段舆情主题讨论内容
周期阶段 主题编号 主题特征词 主题编号 主题特征词
武汉、 肺 炎、 原 因、 发 现、 不 明、 毒 性、 卫生、肺炎、国家、香 港、传 染 病、委 员
Top
ic17 通报、调查、病源、海鲜 Top
ic1 会、响应、启动、措施、个案
起始阶段
患者、 出 院、 隔 离、 治 疗、 治 愈、 观 察、 发热、 咳 嗽、 影 响、 流 感、 感 冒、 症 状、
Top
ic5 医学、密切接触、定点、救治 Top
ic16 孩子、呼吸、发烧、健康

传播、钟南山、专家、感 染、人 传 人、专 确诊、 病 例、 输 入、 上 海、 通 报、 山 东、


Top
ic6 家组、非典、途径、李兰娟、采访 Top
ic7 韩国、泰国、发现、公布
爆发阶段
口罩、 防 护、 消 毒、 市 民、 防 疫、 洗 手、 病例、新增、确诊、累 计 报 告、出 院、死
Top
ic15 提醒、出门、佩戴、指南 Top
ic18 亡、治愈、重症、最新、全省

疫情、 抗 击、 物 资、 加 油、 捐 赠、 全 国、 武汉、 医 生、 救 治、 李 文 亮、 去 世、 病
Top
ic3 防疫、众志成城、捐款、社会 Top
ic10 人、护士、救治、不幸、英雄
波动阶段
口罩、 防 护、 消 毒、 市 民、 防 疫、 洗 手、 传播、钟南山、专家、感 染、人 传 人、专
Top
ic15 提醒、出门、佩戴、指南 Top
ic6 家组、非典、途径、李兰娟、采访

病例、新增、确诊、累 计 报 告、出 院、死 中国、 美 国、 全 国、 意 大 利、 报 道、 政


Top
ic18 亡、治愈、重症、最新、全省 Top
ic2 府、英国、疫情、总统、爆发
长尾阶段
疫情、 工 作、 发 布、 通 知、 企 业、 指 挥 疫情、 新 闻、 工 作、 发 布 会、 直 播、 关
Top
ic13 部、复工、保障、措施、公告 Top
ic9 注、记者、联防联控、机制、国务院

将表 2 与表 1 抽取的热词结果进行对照分 阶段主题抽取的 特 征 词 中 基 本 涵 盖,将 两 种 文


析,TF
-IDF 模型能够 直 接 通 过 各 周 期 阶 段 的 热 本分析方 法 结 合 可 以 更 准 确 地 揭 示 在 生 命 周
词提取,来反映舆 情 事 件 各 阶 段 权 重 较 高 的 词 期各阶段微博舆情的热点主题分布。
汇,而 LDA 模 型 则 抽 象 层 级 更 高, 可 更 好 地 帮 在起始阶段,微 博 发 布 的 热 点 话 题 集 中 在
助研究 人 员 对 多 个 周 期 阶 段 进 行 比 较 分 析。 t
opi
c17、t
opi
c1、t
opi
c5、t
opi
c16, 对 各 话 题 的 特
观察发现,各阶段 文 本 中 权 值 较 高 的 词 语 在 各 征词进行 解 释, 主 题 17 是 陈 述 在 武 汉 发 现 不

33
明原因感染病例 的 调 查;主 题 1 是 描 述 为 了 应 卫生事件的防控工作。
对国家卫 生 健 康 委 通 报 武 汉 出 现 不 明 原 因 病 长 尾 阶 段, 热 点 话 题 集 中 在 t
opi
c18、t
op-
例群组个案,香港 特 区 政 府 启 动 新 型 传 染 病 严 i
c2、t
opi
c13、t
opi
c9,其中主题 18 是 对 患 者 救 治
重应变级别;主题 5 讨 论 的 是 武 汉 市 不 明 原 因 的统计描述持续 受 到 关 注;主 题 2 是 陈 述 公 共
的病例患 者 治 愈 出 院 的 情 况; 主 题 16 陈 述 的 卫生突发 事 件 在 全 球 的 蔓 延 情 况; 主 题 13 是
是不明原因病例的临床表现。 讨论相关 部 门 发 布 的 企 业 复 工 复 产 的 保 障 措
爆发阶段,热点主 题 集 中 在 t
opi
c6、t
opi
c7、 施;主题 9 是关于 全 国 各 地 区 召 开 防 控 工 作 新
t
opi
c15、t
opi
c18, 其 中 主 题 6 是 结 合 该 阶 段 微 闻发布会的情况。
博文本内 容, 描 述 的 是 钟 南 山、 李 兰 娟 等 专 家 4.
4 基于舆情主题演化的舆情管控策略
对于该突发公共 卫 生 事 件 的 解 读;主 题 7 描 述 在新媒体 环 境 下,网 络 舆 情 数 据 呈 现 体 量
的是我国各省市 以 及 泰 国、韩 国 出 现 该 病 例 的 大、传播速度快、价值密度低的特点。 通过对该
情况;主题 15 讨 论 的 是 应 对 该 突 发 公 共 卫 生 疫情事件微 博 的 主 题 分 析,能 够 辅 助 突 发 公 共
事件的防 护 指 南; 主 题 18 陈 述 的 是 患 者 救 治 卫生事件舆情管控工作从纷繁复杂的数据资源
的统计情况。 中挖掘事件发展过程中舆情演化规律以及公众
波动阶段,应对 该 突 发 公 共 卫 生 事 件 的 防 在不同阶段的关注点,本文实验所得的 20 个主
护指南和 钟 南 山 等 专 家 发 布 居 家 康 复 及 防 护 题大致 可 划 分 为 防 护 措 施 及 响 应 (T
opc1、T
i op-
策略仍然是该阶 段 的 热 点,新 增 主 题 3 是 描 述 c3、T
i opc9、T
i opc14、T
i opc19)、突 发 公 共 卫 生 事
i
全国众志 成 城 抗 击 传 染 性 疾 病 的 公 众 组 织 行 件的发生 与 发 展(T
opc4、T
i opc8、T
i opc17)、相 关
i
为,新增主题 10 的 内 容 是 对 一 线 医 护 人 员、警 防护知识 及 科 学 研 究(T
opc6、T
i opc11、T
i opc12、
i
方以及志 愿 者 的 报 道 以 及 对 抗 击 该 传 染 病 英 T
opc15)、国 际 情 况 (T
i opc0、T
i opc2、T
i op
ic7)、 患
雄的致 敬。 为 了 进 一 步 得 到 该 阶 段 三 个 峰 值 者救治 情 况 (Topc5、T
i opc10、T
i opc18)、 该 事 件
i
出现的原因,参照 其 对 应 的 时 间 段 查 找 相 关 微 的影响(T
opc13、T
i opc16) 等 六 个 大 类。 为 了 从
i
博文本发现,第一 峰 的 产 生 主 要 归 因 于 该 突 发 宏观上全面 地 展 示 各 主 题 的 演 化 趋 势,本 研 究
公共卫生事件如 何 发 生 和 传 播 的 科 普,第 二 峰 将实验所得 的 主 题 强 度 值 进 行 可 视 化 展 示,为
的产生原 因 是 李 文 亮 医 生 在 抗 击 该 传 染 病 中 突发公共卫生事件应急响应部门提供有效的决
被感染不幸逝世 而 引 发 网 友 的 热 议,第 三 峰 的 策依据,如图 3 所示。
产生归因 于 习 近 平 亲 自 调 研 指 导 该 突 发 公 共

图 3 主题演化趋势图

总的来说,起始阶 段 各 主 题 热 度 演 化 趋 势 趋于平缓 和 稳 定。 微 博 用 户 通 过 微 博 平 台 密
波动剧烈,同一时期不 同 主 题 之 间 的 热 度 差 异 切关注事 件 的 发 生 与 发 展 情 况 以 及 抗 击 的 措
较大,在爆发期和波动 期 各 主 题 热 度 演 化 趋 势 施和响应,这与牟冬梅等 [30] 发现的在长 生 疫 苗
由波动趋于平缓,长尾 期 各 主 题 热 度 演 化 趋 势 事件微博 舆 情 中 用 户 密 切 关 注 事 件 起 因 和 政

34
府响应的 研 究 结 果 存 在 相 似 之 处。 从 主 题 时 的事件,例 如, 群 众 要 求 相 关 部 门 对 涉 及 李 文
序发展趋势来看,国际 情 况 和 事 件 的 影 响 是 热 亮医生的有关问题作 全 面 调 查,从 而 引 发 事 件
度上升的主题类别,事 件 的 发 生 与 发 展 是 热 度 舆情迅速增长。 结合 上 述 研 究,由 该 阶 段 和 爆
下降的主题 类 别, 防 护 措 施 及 响 应、 患 者 救 治 发阶段的舆情波动来 看,当 舆 情 出 现 较 为 复 杂
情况、相关防护知识与 科 学 研 究 是 热 度 波 动 的 的情感倾向时,通常会 导 致 微 博 舆 情 的 快 速 增
主题类别。 长。 该阶段 管 理 部 门 的 管 控 重 点 在 于 应 急 决
舆情各 个 阶 段 主 题 探 讨 的 内 容 侧 重 点 存 策和响应,同 步 处 置 网 上 舆 情 和 网 下 问 题, 通
在差异, 依 据 前 文 划 分 的 舆 情 事 件 的 四 个 阶 过获取的实时情报,对 事 件 舆 论 的 演 变 情 况 进
段,从主题 的 频 次 占 比 情 况 看, 起 始 阶 段 主 要 行动态分析,相关部门 应 及 时 回 应 公 众 诉 求 以
集中在事件的发生情 况 和 应 对 举 措 等 主 题,是 及告知应对举措,提高政府的公信力。
[23]
对舆情事件 较 为 宏 观 的 探 讨。 这 与 安 璐 等 长尾阶段,防护措施和响应、相关防护知识
发现的 MERS
-CoV 事 件 微 博 舆 情 中 公 众 在 潜 及科学研究 受 到 持 续 关 注,事 件 发 展 情 况 的 关
伏阶段的 主 要 关 注 点 在 首 发 事 件 报 道 上 的 研 注度有所下 降,人 们 逐 渐 开 始 关 注 该 事 件 的 国
究结果相吻合。 管理部门应当第一时间公开透 际发展情 况 以 及 事 件 的 影 响。 需 要 注 意 的 是,
明地提供公 共 卫 生 事 件 发 生 的 初 步 核 实 情 况, 防护措施和 响 应、相 关 防 护 知 识 及 科 学 研 究 在
动态持续发 布 事 件 的 进 展,在 明 确 不 明 原 因 病 后三 个 阶 段 进 行 了 持 续 性 的 讨 论, 这 与 安 璐
原体后,应告知公众相关知识、感染风险及预防 等 [33] 发现的中文埃博拉微博舆情中措施与响应
措施,快速并有针对性地回应民众疑问。 主题在后两个阶段进行了持续性讨论的研究结
进入爆发 阶 段, 防 护 措 施 及 响 应、 相 关 防 果存在相似之处。 相关管理部门应重点对这类
护知识与科学研究成 为 人 们 关 注 的 重 点,同 时 舆情进行监 督 和 干 预,快 速 并 有 针 对 性 地 发 布
对事件发 展 的 关 注 出 现 下 降 态 势。 这 一 阶 段 权威解释,关注该事件对各行各业的影响,如开

信息呈井喷之势,真 假 信 息 混 杂、传 播 速 度 快。 学、就业以及复工复产等问题,出台相关措施并

结合微博 内 容 发 现, 该 阶 段 出 现 了 “ 喝 板 蓝 根 及时发布,做好善后恢复。 通过舆情评估,对整

和熏醋的预防方法、SARS 病 毒 寄 生 蝙 蝠”等 谣 个应对过程 进 行 经 验 总 结,发 现 类 似 事 件 舆 情

言,普通民 众 易 受 到 谣 言 误 导, 引 发 事 件 的 衍 传播应对规 律,在 未 来 类 似 突 发 公 共 卫 生 事 件

生危害。 同 时, 结 合 上 述 研 究 发 现, 在 强 度 较 发生时,可将已有知识快速向情报转化 [20] 。

高的主题中出现了“恐 慌”“焦 虑”等 特 征 词,情 5 结论与意义


[31]
绪化言论增 多。 刘 雅 姝 等 同样发现在超级 本研究 以 近 期 发 生 的 重 大 突 发 公 共 卫 生
真菌感染的舆情事件 中,爆 发 阶 段 是 微 博 用 户 事件为 例,结 合 应 用 TF
-IDF 模 型、LDA 模 型 方
对于舆情 事 件 态 度 情 绪 的 集 中 表 达。 该 阶 段 法和生命周期理论,探 索 微 博 舆 情 发 展 各 阶 段
管理部门的管控重点 在 于 舆 情 引 导 和 控 制,以 的热点主题,勾勒舆情 事 件 主 题 演 化 的 时 序 发
权威评论意见引导民 众 情 绪 理 性 化 尤 为 重 要。 展趋势,追踪不同阶 段 主 题 演 化 规 律。 通 过 实
与网民进行交流互动 和 意 见 沟 通,可 以 帮 助 民 证分析得出以下结论:
众认清 事 实 本 质, 使 各 种 谣 言 趋 于 缓 和 与 平 (1)研究构建的从 “采 集 与 处 理、挖 掘 与 分
息。 网络“意 见 领 袖” 在 舆 情 演 化 和 分 裂 中 有 析、到策略 支 持” 的 全 过 程 舆 情 分 析 框 架 和 采
着重要地位 [32] ,应引导各领域具有权威 性 的 活 用的舆情演化分析方 法,能 够 揭 示 突 发 公 共 卫
跃网民参 与 网 络 舆 情 管 理。 通 过 他 们 的 权 威 生事件微 博 舆 情 传 播 周 期 中 各 阶 段 主 题 的 讨
意见表达,传 达 主 流 价 值 观, 引 导 舆 论 客 观 理 论内容和时序发展趋势。
性正向发展。 (2)从 主 题 讨 论 内 容 来 看, 微 博 用 户 通 过
波动阶段,防护措 施 和 响 应 以 及 相 关 防 护 微博平台 密 切 关 注 该 事 件 发 展 情 况 以 及 抗 击
知识和科学研究依然 是 最 受 关 注 的 话 题,公 众 疫情的有效措施,舆情 各 个 阶 段 主 题 探 讨 的 内
倾向于采取务实的态 度,积 极 了 解 当 前 防 护 知 容侧重点 存 在 差 异。 当 舆 情 出 现 复 杂 情 感 倾
识及国家的应对举 措。 同 时,患 者 的 救 助 情 况 向时,通常会导致舆情 迅 速 增 长 和 网 民 意 见 态
得到热议,该阶段出现 了 一 些 使 舆 论 热 度 波 动 度集中。 从主题时序 发 展 趋 势 来 看,起 始 阶 段

35
各主题强度演化趋势 波 动 剧 烈,在 爆 发 期 和 波 呈现出一定规律,起始 阶 段 舆 情 事 件 相 关 主 题
动期各主题强度演化 趋 势 由 波 动 趋 于 平 缓,长 数量较少且 受 关 注 程 度 低, 未 形 成 规 模 化; 在
尾期各主题强度演化趋势趋于平稳。 爆发期和波动期用户 参 与 量 大 幅 度 提 升,相 关
本研究结论具有 一 定 的 理 论 意 义,以 往 学 主题数增多; 长 尾 期 议 题 信 息 较 少, 较 少 出 现
者在网络 舆 情 的 研 究 中 多 集 中 于 意 见 挖 掘 分 新的关注 点。 相 关 管 理 部 门 在 处 理 类 似 突 发
析,或通过 LDA 模型的训练结果直接进行 主 题 事件时,将舆情传播数 据 波 动 幅 度 与 主 题 强 度
分析。 相 较 于 传 统 主 题 聚 类 分 析, 本 文 基 于 演化规律进行对比,及 时 识 别 舆 情 演 化 的 周 期
LDA 模 型 和 TF
-IDF 权 值 模 型 的 结 果 进 行 对 照 阶段。 另一方面,在舆 情 演 化 周 期 研 判 的 基 础
分析,减少 无 效 高 频 词 对 主 题 分 析 的 影 响, 辅 上, 实 现 舆 情 预 警、 引 导 和 控 制 的 管 理 流 程。
助挖掘隐含的主题 信 息。 同 时,引 入 主 题 强 度 在舆情 传 播 的 起 始 阶 段, 进 行 及 时 研 判 并 预
这一不可直接观测的 抽 象 变 量,其 可 视 化 结 果 警,推进舆 情 良 性 发 展; 在 爆 发 阶 段 和 波 动 阶
可以更加 直 观 地 反 映 各 类 主 题 在 整 个 生 命 周 段,注重舆情引导;在 舆 情 长 尾 阶 段,注 重 舆 情
期中的强度变化,为舆 情 的 观 点 挖 掘 和 主 题 分 评估,探索 舆 情 传 播 应 对 规 律, 形 成 预 案 以 维
析研究提供一定的方法参考。 护社会稳定。
研究结 论 还 能 为 相 关 管 理 部 门 在 处 理 类 本研究仅限于单 个 案 例,数 据 覆 盖 面 和 研
似突发事 件 时 有 效 引 导 与 控 制 网 络 舆 情 的 实 究范围有限,其结论 的 普 适 性 有 待 考 证。 后 续
践工作提供参考。 一 方 面,当 舆 情 传 播 趋 势 在 若对突发 公 共 卫 生 事 件 网 络 舆 情 进 行 更 为 宏
短时间内呈现指数级 增 长 时,舆 情 事 件 即 进 入 观的研究,则需选择更 多 具 有 代 表 性 的 事 件 和
爆发阶段,反之,传播 量 呈 现 规 律 性 递 减 时,舆 更广泛的数据源进行 对 比 分 析,以 便 对 该 类 问
情事件即 进 入 波 动 阶 段。 同 时 主 题 强 度 演 化 题做更深入的研究。

参考文献
[1] S
tat
emen
tont
hesecondmee
tingo
ftheI
nte
rna
tiona
lHea
lthRegu
lat
i s (2005) Eme
on rgencyCommi
tteer
ega
rdi
ngt
he
ou
tbr
eako
fnove
lco
ronav
irs (2019
u -nCoV) [EB/OL] .[2020
-03
-01] .
htps://www.who.
t int/news
-room/de
tal/30
i -
01
-2020
-st
atemen
t-on
-the
-second
-mee
ting
-of
-the
-in
ter
nat
iona
l-hea
lth
-regu
lat
ion
s-( 2005 )-
eme
rgency
-commi
ttee
-re
-
ga
rdi
ng-
the
-ou
tbr
eak
-of
-novel
-cor
onavi
rus-(2019
-ncov) .
[2] 许宝健 .做 好 打 赢 疫 情 防 控 阻 击 战 的 舆 论 引 导 工 作 [EB/OL] .[2020
-03
-01] .
htp://t
t heo
ry.
peop
le.
com.
cn/n
1/
2020/0214/c
40531
-31586385.
html.
[3] F
inkS.
Cri
si t: P
smanagemen lan
ningf
ort
heI
nev
itab
le[M] .
New Yo
rk:Ame
ricanManagemen
tAs
soc
iat
ion,1986:20.
[4] 贾亚敏,安璐,李纲 .城市突发事件网络信息传播时序变化规律研究[J] .情报杂志,2015,34(4):91
-96,90.
[5] 廖海涵,王曰芬,关鹏 .微博舆情传播周期中不同传播者的主题挖掘与观点识别[J] .图书情报工 作,2018,62(19):
77
-85.
[6] 0 环境下企业网络舆情传播过程的研究及实证分析[J] .情报科学,2011,29(12):1810
李纲,董琦 .Web2. -1814.
[7] 吴晓娟 .基于微博文本的网络舆情主题演化分析[D] .南京:南京大学,2018.
[8] Sa
ltonG M, WongA, YangCSA.Avec
torspacemode
lfo
rau
toma
tici
ndex
ing[J] .Commu
nica
tion
so heACM,
ft
1975, 18(11):613
-620.
[9] Sa
ltonG, Buck
leyC.Te
rm-we
igh
tingapp
roachesi
nau
toma
tict
extr
etr
i l[J] .I
eva nfo
rma
tionP
roces
sing & Manage
-
t, 1988, 24(5):513
men -523.
[10] Dee
rwes
terS, Duma
isST, Fu
rnasG W, e
tal.
Index
ingbyl
aten
tseman
ticana
lys
is[J] .Jou
rna
loft
heAme
ricanSo
-
ci
etyf
orI
nfo
rmationScience, 1990, 41:391
-407.
[11] Hof
fmanT.Probabi
li
sti
cl at
entseman ti
canalys
is[J] .Unce
rta
int
yinAr
ti
fi
cia
lIn
tel
lgence, 1999, 15(6):289
i -296.
[12] B
leiD M, NgAY, Jo
rdanMI, e
tal.La
ten
tdi
rich
leta
lloca
tion[J] .Jou
rna
lofMach
ineLea
rni
ngResea
rch, 2003, 3:
993
-1022.
[13] 陈磊, 李俊 .基于词向量的文本特征选择方法研究[J] .小型微型计算机系统, 2018, 39(5):129
-132.
[14] 伊秀娟 .基于 LDA 主题模型的高校新闻话题发现研究[D] .北京:北京交通大学,2019.
[15] 李海磊,杨文忠,李东昊,等 .基于特征融合的 K
-mea
ns微博话题发现模型[J] .电子技术应用,2020,46(4):24
-28,33.
[16] Kee
lanJ, Pav
riV, Ba
lak
ris
hnanR, e
tal.Anana
lys
iso
fthe HumanPap
il
loma V
iru
svacc
inedeba
teon MySpace
b
logs[J] .Vacc
ine, 2010, 28(6):0
-1540.
[17] MaYP, Sh uX M, ShenSF, e tal.Studyonne
two
rkpub
licop
ini
ond
issemi
nat
ionandcop
ings
tra
teg
iesi
nla
rgef
ire

36
d
isas
tes[J] .P
r roced
iaEng
inee
ring, 2014, 71:616
-621.
[18] 刘继,李磊 .大数据背景下网络舆情智能预警机制分析[J] .情报杂志,2019,38(12):92
-97,183.
[19] 姚乐野,范炜 .突发事件应急管理中的情报本征机理研究[J] .图书情报工作,2014,58(23):6
-11.
[20] 曾子明,黄城莺 .面向疫情管控的公共卫生突发事件情报体系研究[J] .情报杂志,2017,36(10):79
-84.
[21] 贾亚敏,安璐,李纲 .城市突发事件网络信息传播时序变化规律研究[J] .情报杂志,2015,34(4):91
-96,90.
[22] 崔鹏 .面向突发公共事件网络舆情的政府应对能力研究[D] .北京:中央财经大学,2016.
[23] 安璐,杜廷尧,李纲,等 .突发公共卫生事件利益相关者在社交媒体中的关注点及演化模式[J] .情 报 学 报,2018,37
(4):394
-405.
[24] B
leiD M,NgAY,Jo
rdanMI.
Lat
entd
iri
chl
eta
lloca
tion[J] .
Jou
rna
lofMach
ineLea
rni
ngResea
rch,2003,3:993
-1022.
[25] 王海林,张雅君 .基于 LDA 的长短文本分类比较[J] .数字技术与应用,2016(10):230.
[26] 谢永俊,彭霞,黄舟,等 .基于微博数据的北京市热点区域意象感知[J] .地理科学进展,2017,36(9):1099
-1110.
[27] 王德川 .基于 LDA 模型的中美欧农业科研项目研究主题分析[D] .北京:中国农业科学院,2017.
[28] 崔凯 .基于 LDA 的主题演化研究与实现[D] .长沙:国防科学技术大学,2010.
[29] TuW,TangH,ChenF,e
tal.Ep
idemi
cupda
teandr
iskas
ses
smen
tof2019Nove
lCo
ronav
iru
s-Ch
ina,Jan
uay28,2020
r
[J] .
Chi
naCDC Week
ly,2020,2(6):83
-86.
[30] 牟冬梅,邵琦,韩楠楠,等 .微博舆情多维度社会属性分析与可 视 化 研 究———以 某 疫 苗 事 件 为 例 [J/OL] .图 书 情 报
工作 .[2020
-04
-23] .
ht
tps://do
i.o
rg/10.
13266/j.
iss
n.0252
-3116.2020.03.012.
[31] 刘雅 姝,张 海 涛,徐 海 玲,等 .多 维 特 征 融 合 的 网 络 舆 情 突 发 事 件 演 化 话 题 图 谱 研 究 [J] .情 报 学 报,2019,38(8):
798
-806.
[32] 郭春侠,刘惠,储节旺 .新媒体环境下网络舆情治理大数据能力建设研究[J] .情报理论与实践,2018,41(12):46
-54.
[33] 安璐,杜廷尧,余传明,等 .突发公共卫生事件的 微 博 主 题 演 化 模 式 和 时 序 趋 势———以 Twi
tte
r和 We
ibo 的 埃 博 拉
微博为例[J] .情报资料工作,2016(5):44
-52.

(收稿日期:2020
-04
-24)

(上接第 27 页)
[6] 工信部:目前已有 20 余 款 人 工 智 能 系 统 应 用 于 全 国 数 百 家 医 院 [EB/OL] .[2020
-03
-27] .h
ttps://www.
vzkoo.
com/doc/9138.
html.
[7] I筑牢疫情防线 铜陵“城市超脑”显成效[J] .中国建设信息化, 2020(5): 69
吕瑞瑞 .A -71.
[8] Yass
ineHM,ShahZ.
Howcou
ldar
ti
fi
cia
lin
tel
li
gencea
idi
nt hefigh
tagai
nstco
ron
a v
irs? Ani
u nte
rvi
eww i
thDrHadiMYa
ssi
ne
an
dD rZuba
irSh
ahbyFe
li
ci
tyPooe,Comm
l i
ssi
oni
ngEdi
tor[J] .
Expe
rtRevi
ewo fAnt
i-i
nfe
cti
veTh e
r y,2020:1
ap -5.
[9] XuX, J
iangX, MaC, e
tal.Deepl
ear
nings
yst
emt
osc
reenco
ronav
iru
sdi
sease2019pneumon
ia[J/OL] .[2020
-03
-
27] .a
rXi
vPr
ePri
nt, 2020, arX
iv:2002.09334.htp://a
t r
xiv.
org/abs/2002.09334.
[10] Santos
hK.AI
-dr
iventoolsf
o rcoronav
iru
sou t
break: Needofac
tivelear
ningandc ros
s-popu
lat
iont
ran/t
i estmode
lson
mu
lt
it
udi
nal/mu
lt
imoda
lda
ta[J] .Jou
rna
lofMed
ica
lSy
stems, 2020, 44(5): 1-
5.
[11] 从疫情防控到社会治理,百 分 点 数 据 智 能“显 身 手”[EB/OL] .[2020 - 03
-27] .ht
tps://c
loud.
tencen
t.com/deve
lop
-
r/news/589099.
e
[12] 第四范式人工智能助 力 疫 情 防 控:精 准 防 控、疫 情 推 演 及 病 毒 溯 源 [EB/OL] .[2020
-03
-27] .
htp://v
t r.s
ina.
com.
n/news/h
c z/2020
-02
-10/doc
-iimxx
stf
0307176.
shtml.
[13] IDC,浪潮 .2018 -2019 年中国人工智能计算力发展评估报 告[R/OL] .[2020
-03
-27] .h
ttps://www.
shangyex
inz
hi.
com/a
rti
cle/142725.h
tml.
[14] 杭州大数据产业联盟 .中国人工智 能:核 心 算 法 缺 失 或 成 A
I发 展 瓶 颈 [EB/OL] .[2020
-03
-20] .
htps://www.
t so-
h
u.com/a/312274159_100195267.
[15] Al
imadadiA, Ar
yalS, Manandha
rI, e
tal.Ar
ti
fi
cia
lin
tel
li
genceand mach
inel
ear
ningt
ofi
ghtCOV
I 19[J] .
D- Phy
sio
l
Genomic
s.2020,52(4):200
-202.
[16] Peng M, YangJ, Sh
iQ, e
tal.Ar
ti
fi
cia
lin
tel
li
genceapp
lica
tioni
nCOV
ID-
19d
iagnos
isandp
red
ict
ion[J] .2020, 2
(2):237
-246.
[17] Al
lam Z, JonesD S.Ont
heco
ronav
irs (COV
u I 19) ou
D- tbr
eakandt
hesma
rtc
ityne
two
rk: Un
ive
rsa
lda
tas
har
ing
st
andardscoup
ledwi
tha
rti
fi
cia
lin
tel
lgence (A
i I)t
obene
fi
tur
banhea
lthmon
ito
ri t[J] .
ngand managemen Hea
lthca
re,
2020,8(1)
[18] 中国信息通信研究院 .数字孪生城市研 究 报 告 (2019 年 )[EB/OL] .[2020
-03
-10] .
htp://www.
t cai
ct.
ac.
cn/kxy
j/
qwf
b /bps/201910/P020191011522620518262.
pdf.

(收稿日期:2020
-04
-09)

37

You might also like