Professional Documents
Culture Documents
考虑兴趣偏好和多事件影响的网络事件推演模型研究
臧 洁,任 旭
( 辽宁大学 信息学院,辽宁 沈阳 110036)
摘 要: 通过建模对网络事件传播推演进行研究是网络舆情领域的重点研究方向,现有模型存在事件容量
小、仅能容纳单一事件以及忽略用户个体兴趣偏好的缺陷. 因此,本文首先提出兼顾平台用户兴趣特征与个体
偏好差异性的元胞自动机矩阵;其次在经典 SIR 传染病模型的基础上,针对多事件容量改进得到多重 SIR 状
态转换关系,构建出适用于网络事件的传播推演模型. 经过推演实验得出,该模型针对不同类型事件同时期扩
散程度对比指标表现良好. 同时,为了进一步验证模型的有效性,本文对辟谣信息传播过程采用了双信息源共
同传播方式进行推演,为网络舆情研究提供了新的参考.
Abstract: It is a key research direction in the field of network public opinion to study the
propagation mode of network events through modeling. Existing models have some defects,such as
small event capacity, a single event accommodate and the user′ s individual interest preferences
which are ignored. Firstly,this paper proposes a cellular automata matrix which takes into account
the overall user interest characteristics and individual preference differences of the platform.
Secondly,the propagation deduction model suitable for network events is constructed based on the
classical SIR epidemic model, and the multiple SIR state transition relationship is obtained by
improving the multi⁃event capacity. Through the deduction experiments, the model for different
types of events in the same period diffusion degree contrast index performance is effective. At the
same time, in order to further verify the validity of the model, the double information source
common propagation way is used to deduce for the rumor information dissemination process. It can
收稿日期:2021 - 12 - 24
基金项目:辽宁省经济社会发展立项课题(2019lslktqn - 023) ;辽宁大学本科教学改革研究项目( JG2018ZC81)
作者简介:臧洁(1979 - ) ,女,山东日照人,博士,副教授,研究方向:网络舆情、大数据应用.
第4 期 臧 洁, 等: 考虑兴趣偏好和多事件影响的网络事件推演模型研究 299
0 引言
随着互联网的快速发展和手机等智能设备的普及,互联网已成为我国民众日常生活中必不可少
的信息获取渠道和交流方式. 民众通过互联网发表和传播各种观点情绪,其中流行于互联网上对于
某些事件不同看法的总和,称为网络舆情. 网络舆情是由于各种事件的刺激而产生并通过互联网传
播,人们对于该事件的认知、态度、情感和行为倾向 [1] . 互联网信息的传播方式极大地缩短了社交距
离,如何准确捕捉网络舆情动态、掌握相关规律并及时进行应对,成为众多学者的研究热点.
同时,随着计算机建模仿真技术的发展,越来越多的学者尝试将其应用到网络舆情研究中. 尽管
网络舆情的传播是一个整体过程,但是从模型仿真角度对其进行研究,需要同时兼顾社交网络结构
不同、网民特征属性不同、事件特征属性不同和传播过程的随机性等诸多因素;并且每一项因素的变
化都会使最终的网络舆情传播结果产生变化,对于这样一个复杂系统的仿真难度可想而知. 针对此
现状,学者们提出了各种有针对性的模型进行仿真,其中 Bolzern 等 [2] 提出了一个动态的随机多智能
体模型,研究社交网络中群体行为存在的特征;赵磊等 [3] 采用 BP 神经网络的理论构建模型,使得模
型能够对舆情事件热度变化趋势有更精确的仿真效果;兰月新等 [4] 采用多维函数构建出网络舆情演
化高维模型;Wang 等 [5] 在舆情传播模型中引入博弈论,提出基于一对多博弈的舆情传播模型;马宇
红等 [6] 建立了基于 BA 无标度网络的谣言传播模型,对网络谣言的传播规律进行仿真分析;魏德志
等 [7] 将博弈论与传染病 SIRS 模型相结合,探寻热点话题传播过程中的规律;Chen 等 [8] 使用 SIRS 模
型对信息扩散过程中的舆论极化现象进行研究;何英等 [9] 使用 Matlab 构建网络舆情扩散方向估计
模型,可以提高网络舆情突变扩散方向的判断精确度;秦涛等 [10] 采用排序学习的方法实现了对网络
舆情事件演化态势的评估;董靖巍 [11] 、索琪等 [12] 着重于研究复杂网络结构下的舆情演化;曹海军
等 [13] 、哈达等 [14] 应用系统动力学理论构建舆情传播模型. 上述研究中所采用模型以及研究对象的多
样性,也印证了网络事件传播研究内容的广泛程度.
但是在这些研究中,大部分模型弱化事件区分,将模型构造的关注点落在用户影响力差异化以
及社交关系中. 首先,模型忽略了用户的个体兴趣偏好对网络事件传播的影响,根据网络舆情的特
点,整体网络用户的兴趣偏好对于网络事件的传播会产生不同的影响;其次,忽略了不同类型事件在
互联网中受关注的程度,模型中仅能容纳单一事件,但是根据研究发现互联网中各种事件共享同一
网络空间,这些事件对于民众的注意力呈现竞争关系,对于网络事件的传播会产生影响. 因此,本文
在以上研究的基础上,考虑用户个体兴趣偏好和多事件影响,采用元胞自动机( Cellular Automata,
CA) 原理,首先提出兼顾平台总体用户兴趣特征与个体偏好差异性的 CA 矩阵;其次在经典 SIR 传
染病模型的基础上,针对多事件容量改进得到多重 SIR 状态转换关系,构建了适用于网络事件的传
播推演模型,并通过实例进行了验证,仿真实验验证了模型的有效性.
300 辽宁大学学报 自然科学版 2022 年
1 基础理论
1. 1 CA 模型
20 世纪 50 年代初,为了模拟生命系统所具有的自复制功能,计算机之父冯·诺依曼( J. von
Neumann) 提出了 CA 模型. 它是一种网格动力学模型,关键理论为采用离散的空间布局和时间间
隔,将元胞( Cellular) 分成有限种状态,元胞个体状态的变化仅与其当前状态以及某个局部邻域的状
态有关. 公式化描述为任一元胞 C i 的下一时刻状态 S ti + 1 ,仅由当前时刻元胞 S ti 自身状态和有限邻域
内元胞状态 S tN 所决定,即 C i ←S ti + 1 = f( S ti ,S tN ) ,其中 f( S ti ,S tN ) 为具体转换规则.
因其上述特征,多年来众多学者将其应用于社会学、生态学和计算机科学等领域. 网络事件的传
播过程可以看作网民所代表的网络节点间对于事件信息的交换过程,在 CA 模型中体现为元胞间进
行信息传递、改变自身状态的过程. Alves 等 [15] 于 2002 年将 CA 理论应用于自由选举舆情分析;王根
生等 [16] 也在 CA 网络舆情应用中进行了一系列研究. 近年来,CA 在网络舆情方面的应用更加细化,
毛乾任等 [17] 关注于网络舆情观点聚合,后续还针对导控策略影响下的网络舆情传播 [18] 进行了研究;
姚翠友等 [19] 提出基于用户属性的微博舆情演化 CA 模型;滕婕等 [20] 将 CA 模型应用于群体辟谣信
息的扩散效果预测. 上述研究从不同角度均取得了一定的成果,展现出了 CA 应用于网络舆情研究
的潜力.
但对于网络舆情的元胞矩阵构建,在个体差异化的表现形式上,重点区分普通用户、舆论领袖、
政府等个体属性影响力 [18 - 19] ,或者是将元胞区分为传谣个体和辟谣个体 [20] . 这两种方式都存在自
身不足,首先元胞矩阵容量不足,过于区分普通用户、舆论领袖等个体差异化元胞,会过渡放大舆论
领袖以及政府账号的传播作用,非普通用户元胞的数量稍有变化就会对推演结果产生较大影响. 而
且,在当前网络社交平台中,不良事件传播很少经过已有舆论领袖进行,都是网民之间自发传播造成
影响力. 对于传谣辟谣用户,在不清楚信息是否真实的状态下,普通用户无法确认事件真假,所以并不能
给予普通用户属性上的认定,对此,本文构建了具有个体偏好差异化的元胞矩阵用以改善上述问题.
1. 2 SIR 传染病模型
SIR 模型是传染病模型中经典的模型之一,由 Kermack 与 McKendrick 在 1927 年用动力学方法
构建. 其原理为,假设总人数 N 不变,将总人数分为 S( Susceptible) 代表易感者、I( Infective) 代表感染
者、R( Removal) 代表移出者等 3 部分. 易感者
S 会受感染者 I 影响,依据传染率 β 变为感染
者 I,感染者 I 在依据恢复率 γ 被治愈后,会变
为移出者 R 不会再被感染,如图 1 所示. 因传
图1 SIR 状态转换规则
染病在人际中的传播过程与网络事件在网络
空间中传播的过程类似,网民在整个过程中对于事件的感知也可以划分为对应状态,所以近年来 SIR
模型在网络舆情方向有诸多研究. Zhao 等 [21] 将 SIR 模型应用于新型传播网络中,使用数值分析法进
行动力学分析;王谢宁等 [22] 对 SIR 模型应用平均场理论以及小世界网络,进行有针对性的假设,并
对社会化网络中的规律进行探究;陈波等 [23] 提出 SEIR( Susceptible Exposed Infected Removed) 传播
模型,考虑到传染病存在一定潜伏期,用状态 E 表示潜伏,对 SIR 模型的网络舆情应用进行了扩充;
第4 期 臧 洁, 等: 考虑兴趣偏好和多事件影响的网络事件推演模型研究 301
2 改进的网络事件传播推演模型
2. 1 考虑用户兴趣偏好的个体差异化元胞矩阵构建
对网络用户个体进行合理描述是模型合理性的基础,CA 模型应用于网络舆情研究,需要通过构
建元胞矩阵对真实网络空间进行微缩来描述用户间的社交关系. 但是矩阵所包含的元胞数量有限,
既要体现出不同用户所具有的个体差异,又要在有限数量的元胞之间构建起合理的用户比例,这需
要对元胞矩阵进行重新构建. 现有研究多基于用户权重对该问题进行研究,本文将用户个体兴趣偏
好作为个体差异化指标进行元胞矩阵构建,提出了考虑用户偏好的具有个体差异化的元胞矩阵.
初始元胞偏好的构建不随后续事件推演发生变化,不同用户对于不同事件具有不同的偏好排
序,首选偏好类型,元胞感知度强,次选偏好类型的感知度弱. 个体元胞偏好受整体矩阵元胞偏好比
例限制且随机分布,该特征具有平台通用性,如新闻资讯服务平台、社交网络平台、网络文化平台、综
合性社区等,可根据不同平台自身用户画像进行比例重构. 以微博为例,根据微博平台给出的 2021
上半年微博热搜榜趋势报告,2021 年 6 月热搜统计中,26% 为娱乐热点,36% 为社会热点,38% 为垂
直热点. 其中垂直热点涵盖众多垂直话题,如企业、美食、科技、文化等,根据此比例可以逆推微博用
户偏好比例. 应用于个体差异化元胞矩阵中首选偏好构建的比例为:社会 36% 、明星 13% 、综艺
13% 、美食 8% 、文化、军事、科技、情感、财经各 6% ;次选偏好比例相同,且保证同一元胞中首选偏好
与次选偏好不同.
根据上述比例构建的初始元胞矩阵,宏观上表现出整个矩阵用户群体兴趣比例,微观上体现出
每个元胞自身兴趣偏好不同,充分展现了元胞代表的用户个体间存在的差异化特征.
2. 2 考虑多事件影响的多重 SIR 状态转换
为了体现多事件的竞争关系,使得事件容量更大,本文将多事件传播情况考虑在内,重构了多重
SIR 状态转换. 单一用户可以同时暴露在多个事件信息的影响之下,根据个体偏好不同决定后续受
到哪一具体事件影响进行传播或免疫. 而且,针对辟谣信息的推演,改进后的多重 SIR 状态转换,能
够将谣言信息与辟谣信息同时作为信息源放入网络空间中进行传播.
因整个模型包含有限种不同的状态 S0 ,S1 ,…,S n ,并且单一用户同一时刻仅能展现一种状态
S t
i,j = S a ( S a ∈{ S1 ,S2 ,…,S n } ) ,具体状态转换如图 2 所示,状态转换对应参数如表 1 所示.
302 辽宁大学学报 自然科学版 2022 年
表1 改进后的状态转换关系及参数
状态 后续状态 转换概率阈值
离线状态 S0 S0 →S1 P01
图3 元胞矩阵示意图
3 实验
3. 1 实验环境
本文构建的模型开发工具为 Matlab,运行环境为 Windows 10 20H2 版本 64 位操作系统,计算机
采用 2. 30GHz,Intel( R) Core( TM) i7 - 10 875H 处理器,16GB 内存.
本文 3. 2、3. 3 节所使用的有效元胞矩阵大小设置分别为 200 × 200 和 300 × 300,元胞偏好比例
如 2. 1 节所示,初始元胞在线状态密度为 D t0 = 0. 70.
3. 2 模型事件趋势拟合
基于本文提出的网络事件推演模型,对网络事件扩散趋势进行研究. 案例选取为 2021 年 11 月
23 日发生的网络热点事件:甲———“ 中演协公布网络主播警示名单” ,乙———“ 谭咏麟发生辟谣网传
消息” . 模型转换参数设置依次为:P01 = 0. 001;P10 = 0. 000 5;P12 = 0. 2;P13 = 0. 1;P2I = 0. 8;P2R =
0. 2;P3I = 0. 7;P3R = 0. 3;P Concentration = 0. 5. 模型进行 2 000 次迭代推演,以求得长时间跨度下事件扩散
趋势. 其中,事件甲包含社会与明星复合属性,初始信息源为政府,爆发点数量为 4;事件乙为单一明
星属性,初始信息源为明星个体,爆发点数量为 1. 两事件同时放入模型中进行同步扩散推演,统计事
件扩散过程中的累计传播范围,结果如图 4 所示.
304 辽宁大学学报 自然科学版 2022 年
图4 事件甲乙传播推演曲线 图5 事件扩散归一化拟合曲线
3. 3 辟谣情况推演
为了进一步验证改进的网络事件推演模型的有效性,对辟谣信息也进行了推演. 辟谣信息扩散
具有特殊性,即网络谣言与辟谣信息发生时间点不同,各自可以被看作是单独事件同时进行传播,但
辟谣信息的传播可以对谣言分布区域产生覆盖作用,受到辟谣信息影响的用户观点会产生变化. 对
于这种情况,本文提出的网络事件推演模型需要作出具有针对性的调整,即将先发生的网络谣言作
为普通事件进行推演,辟谣信息延迟出现且在扩散过程中对于已有谣言传播用户有较大强度影响
力. 在谣言信息与辟谣信息整体存在竞争关系的基础上,辟谣信息也作为谣言信息传播的后续状态,
修改后能够将谣言信息与辟谣信息放在模型中进行同步推演. 实验分为不同辟谣方式推演和辟谣时
间差推演两部分. 辟谣信息转换关系对应参数如表 2 所示,调整后的元胞状态转换如图 6 所示.
表2 辟谣信息状态转换关系及参数
状态 后续状态 转换概率阈值
离线状态 S0 S0 →S1 P01
在线状态 S1 S1 →S0 ,S1 →S21 ,S1 →S31 P10 ,P12 ,P13
受谣言信息影响 S21 S21 →S22 ,S21 →S null P2I ,P2R
传播谣言信息 S22 S31 P23 ( 强化影响力)
受辟谣信息影响 S31 S31 →S32 ,S31 →S33 P3I ,P3R
传播辟谣信息 S32 NULL —
信息免疫用户 S null NULL —
图6 辟谣信息传播状态转换图
辟谣方式分为当事人辟谣、第三方辟谣以及当事人和第三方混合辟谣 3 种. 当事人辟谣表现为
谣言初始传播点发布辟谣信息,第三方辟谣表现为谣言信息与辟谣信息初始传播点不同,混合辟谣
为上述两种辟谣方式共同作用. 辟谣时间差实验,以谣言初始传播时间 t0 为参照,辟谣信息发布分别
延后 150、300、450 次,模型迭代开始进行混合辟谣,统计每次迭代谣言覆盖范围并绘制曲线. 通过模
型推演,观察不同辟谣时间差效果,结果如图 7、8 所示.
图7 辟谣方式比较结果 图8 时间差推演结果
4 结语
针对目前在网络舆情建模领域研究中存在的模型事件容量小、忽略个体偏好差异性的问题,本
文提出了一种关注于网络用户个性化偏好差异性、可容纳多事件共同传播的网络事件传播推演模
型. 通过实验,本文提出的模型对于不同类型事件共同扩散方面具有良好效果,并且模型能够将谣言
信息与辟谣信息放在模型中进行同步推演. 本文对于事件类型划分略显粗糙,仅通过理论说明模型
具有不同平台通用性的问题. 在未来的研究中,会收集更多真实数据对模型进行改进,发挥模型自身
优势以适用于更多网络舆情应用场景.
参 考 文 献: