You are on page 1of 7

2023 年 10 月 情报探索 第 10 期( 总 312 期)

Oct. 2023 Information Research No. 10( Serial No. 312)

基于 LDA 主题模型的中国国家形象研究
———以越南通讯社报道为例
覃秋荣
( 广西大学新闻与传播学院 广西南宁 530004)
摘 要:[ 目的 / 意义] 越南通讯社作为越南官方媒体,具有一定地位,研究其如何报道中国、如何建构中国国家形象对于中
国完善国际传播的形式、考量未来与越南的发展方向具有重要意义。 [ 方法 / 过程] 使用文本挖掘的研究方法,对越南通讯社官
方网站 2022 年 1 月至 2023 年 5 月的涉华报道进行内容分析,使用 LDA 主题模型提取媒体报道的重要主题,通过主题分析揭示
越南媒体报道建构的潜在中国形象,并将研究结果可视化。 [ 结果 / 结论] 从文本集中共提取到 7 个主题,进行主题聚类后赋予
主题名称并展示 15 个关键词。 越南官方媒体塑造的中国形象既有大国崛起的“ 威胁” ,又是经济发展的机遇,还有文化“ 同化”
的风险。
关键词:LDA 主题模型;中国国家形象;越南通讯社
中图分类号:G206 文献标识码:A doi:10.3969 / j.issn.1005-8095.2023.10.006

Study of China’ s National Image Based on LDA Model:


Case Study of Vietnam News Agency’ s Report
Qin Qiurong
( School of Journalism and Communication, Guangxi University, Nanning Guangxi 530004)

Abstract: [ Purpose / significance] As the official media of Vietnam, Vietnam News Agency ( “ VNW” for short) has a certain sta⁃
tus. Studying how it reports on China and how to construct China’ s national image is important for China to improve the form of interna⁃
tional communication and consider the future direction of development with Vietnam. [ Method / process] This paper uses the research
method of text mining to analyze the content of China-related reports on the official website of VNA from January 2022 to May 2023, uses
the LDA models to extract the important topics of media reports, reveals the potential China image constructed by Vietnamese media re⁃
ports through thematic analysis, and visualizes the research results. [ Result / conclusion] A total of 7 topics are extracted from the text
set. After topic clustering, topic names are given and 15 keywords are displayed. The image of China shaped by Vietnamese official media
has both the “ threat” of the rise of a great power, the opportunity of economic development, and the risk of cultural “ assimilation” .
Keywords: LDA model; China’ s national image; VNA

0 引言 由贸易区的开设,《 区域全面经济伙伴关系协定》 的
国家形象作为国家软实力的重要组成部分,对 签订等有了更多互惠往来。 越南在东南亚国家中具
一个国家在全球政治中的战略地位具有重要作用。 有一定影响力,作为中国的邻居、伙伴与竞争对手,
中国国家形象的建构包含基于民族文化特性与对外 对于中国国家形象的建构可能发挥积极作用,也可
话语权争夺而“ 自塑” 的形象,也包括其他国家和民 能发挥消极作用。 越南通讯社( 简称越通社) 作为官
族基于对中国的现实观察和政治目的而“ 他塑” 的形 方媒体,是越南民众了解信息的来源,研究其如何报
象。 中国与越南有着数千年的交往史,两国毗邻而 道中国、如何建构中国国家形象对于中国完善国际
居,在历史的长河中曾是亲密无间的伙伴,也曾兵戎 传播的形式、考量未来与越南的发展方向具有重要
相向;在南海问题上发生过争端,也因中国—东盟自 意义。

收稿日期:2023-06-15
作者简介:覃秋荣(1999—) ,女,2021 级硕士研究生,研究方向为网络与新媒体。

37
2023 年 10 月 情报探索 第 10 期( 总 312 期)

1 文献综述 的作用,对塑造国家形象相关研究具有重要意义,但
1.1 LDA 主题模型 是公众的态度极大程度会受到媒体的影响,该研究
Blei 等人于 2003 年提出 LDA 主题模型( Latent 没有从媒体的角度进行分析。
Dirichlet Allocation) ,这是一种文档主题生成模型。 同时,随着中国与东南亚国家的交往越来越频
由于包含词、主题和文档三层结构,也被称为三层贝 繁,如何向东南亚国家塑造全面立体的中国国家形
叶斯概率模型。 [1]
LDA 可以用来推测文档的主题分 象、东南亚国家如何看待中国成为研究的热点,通过
布,根据词语的概率分布情况推导出文章主题的概 内容分析的方法研究东南亚国家的涉华报道也早有
率分布情况,因此可以用于识别文本数据中隐含的 先例。 罗奕以东盟国家大众媒体的涉华报道为研究
主题。 运行 LDA 模型得到文档的主题分布后,就可 对象,对报道进行舆情分析,他认为这些报道虽存在
以根据主题分布进行主题聚类或文本分类。 [2]
LDA 偏颇,但中国国家形象传播策略的制定也可从中挖
采用的是词袋模型,不计词汇出现的顺序,即仅考量 掘参考价值。[8] 该研究以东盟国家大众媒体为研究
其在文档中是否出现。 很多词语构成主题的概率分 对象,虽然全面,但却缺乏针对性。 东南亚各个国家
布,多个主题又构成文档的概率分布。 LDA 主题模 之间的差异也将导致不同国家对中国的看法不同。
型不是单纯的词频统计,而是词语、主题与文档之间 李春霞与黄敏则聚焦于越南,李春霞以越南 《 人民
的概率统计,能够精确客观地揭示词项间的语义关 报》 为样本分析了越南官方媒体的中国认知变迁,从
[3]
联,有助于分析文本深层次的语义关系。 榜样到伙伴、从追赶到平等,关注的政治领域从低级
1.2 当前研究概况 到高级。[9] 但是该研究重点在于越南官方媒体对中
LDA 主题模型应用的科学性已经有学者在实例 国的认知,而非其塑造的中国国家形象。 黄敏用内
中进 行 佐 证, Xu 等 通 过 LDA 主 题 模 型 与 基 于 容分析法研究了越南《 年轻人报》 报道中的中国形
kmeans 文本挖掘的方法相比较,抽取网络新闻文本 象,更详尽精准地分析出中国在越南民众心目中的
中的 话 题 内 容, 发 现 LDA 主 题 识 别 的 结 果 更 准 形象。[10] 该研究虽关注到越南媒体报道中的中国形
确。[4] 长期以来有大量学者利用 LDA 主题模型挖掘 象,但是所取样本已经过于陈旧。
文档的潜在主题及其演化趋势,LDA 主题模型已经 主题建模在文本挖掘、医学、经济学、社会网络
成为一种有效且热门的方法。 就传播效果研究而 分析等领域都有着广泛的应用,但却很少有研究使
言,尹章池等利用包含 LDA 主题模型在内的研究计 用 LDA 主题模型来研究越南官方媒体的涉华报道
算工具获取量化数据,探讨微博上两大公益博主的 并以此分析中国国家形象。 因此,本文基于 LDA 主
传播策略,及其在不同维度内形成的传播效果。 [5]
该 题模型对越南官方媒体越通社 2022 年以来的报道
研究所取的样本是微博博文,因此只能看到 LDA 主 内容进行分析,挖掘报道潜在主题,并分析越南官方
题模型在短文本中的应用情况。 就网络舆情研究而 媒体试图构建的中国国家形象。
言,李振鹏等利用 LDA 主题模型基于天涯杂谈语料 2 研究方法
库对帖子分类,探究天涯杂谈版块的网络舆情方向 本文使用文本挖掘的研究方法对媒体报道进行
[6]
和网民态度。 该研究虽然在网络舆情监测方面为 数据分析与可视化。 首先进行数据收集,收集特定
研究者提供了良好的方向,但却缺乏一定国际视野。 时间范围内更具权威性与相关性的媒体报道文章,
就国家形象研究而言,段淳林等运用 LDA 主题模型 创建新闻文本语料库;其次对文本进行预处理,目的
分析“ 一带一路” 背景下的网络舆情及公众态度,得 在于去除冗余与无意义信息;再进行 TF -IDF 向量化
到的主题基本都是积极的反馈,表明该倡议确实能 处理,以确定词语重要性;最后利用 LDA 模型提取
[7]
够驱动国家品牌形象构建。 该研究以公众态度的 主题与关键词,并将结果可视化。 具体操作步骤如
视角分析了“ 一带一路” 倡议对于构建中国国家形象 图 1 所示。

图1 数据处理流程图

38
2023 年 10 月 覃秋荣:基于 LDA 主题模型的中国国家形象研究 第 10 期( 总 312 期)

2.1 数据收集 verse Document Frequency,TF - IDF) 方法将进行过预


越通社是越南的国家通讯社。 作为官方消息来 处理的文本数据转换为向量。 TF - IDF 是一种进行
源,不仅向世界传递越南的信息,也将其他国家的信 自然语言数据处理的统计方式,TF 指词语在一篇文
息传回国内,因此本研究新闻报道数据取自越通社 章中出现的频率;IDF 指词语在整个文本语料库的
官方中文网站。 2022 年 1 月 1 日,新年伊始,国际格 全部文章中出现的频数的倒数。 使用 TF 和 IDF,可
局与国际关系动荡剧烈,包括中国、东盟十国在内的 以有效评估样本单词在整个文本语料库中的重要性
15 个国家签署的《 区域全面经济伙伴关系协定》 正 程度,并过滤掉常见的、不相关的词汇,同时保留影
式生效,在新机遇与新挑战的背景下,媒体对于中国 响整个文本的重要单词。 预处理后的文本数据变成
形象的建构也有了不同改变,因此以该事件为时间 了零散的词语集合,每篇文章经过 TF -IDF 向量化处
节点,选取越通社在 2022 年 1 月 1 日至 2023 年 5 月 理会变成由 1 × n 个实数表示的特征向量,筛选后留
31 日期间发布的报道作为研究对象。 在越通社官 下的 337 篇文章向量化处理后会产生一个 337 × n 的
方网站以“ 中国” 为关键词进行检索,限定上述时间 特征矩阵。
范围,共搜集到 529 篇新闻报道。 2.4 主题与关键词提取
2.2 文本预处理 将构建好的特征矩阵放入 LDA 模型中提取主
2.2.1 噪音数据过滤 题与关键词,并计算主题概率分布情况。 经过数据
在 529 篇报道中,有些文章的主题与中国无关, 预处理后,对预处理后的文本进行分类训练,并拟定
只是文中提及中国,而没有对中国进行任何实质性 在区间 [1,9] 内的整数作为候选主题数,得出不同主题
的讨论。 为了关注与中国实质相关的新闻报道,要 数下的困惑度数值,如图 2 所示。 图 2 的折线图显
对收集到的新闻文本进行人工筛选,去除重复报道 示,随着主题数的增加, 困惑度呈现一路走低的态
及不相关报道。 筛选规则为:与中国相关的关键词 势,而后在主题数为 8 时开始上升。 困惑度越低,文
必须在标题或正文第一段中至少出现一次,并且在 档归属于某一潜在主题的可能性就越高,即模型的
全文中至少出现两次。 筛选过后剩余 337 篇报道, 聚类效果越好。 困惑度的极小值点出现在主题数为
保存为一个文本文件供后续处理。 7 的模型选择上,因此主题数的数值设定为 7。 分析
2.2.2 中文分词处理 过程使用 Python 版本 3.8,并使用 LDAvis 工具对计
在对中文文本分析前要进行中文分词处理,这 算结果进行可视化处理。
是中文文本处理的基础步骤之一。
采用 python 中的 jieba 包对报道文本进行分词,
jieba 包自带词典,但是分词原理基于特定算法,无法
识别一 些 专 业 名 词, 例 如 “ 新 冠 肺 炎” 会 被 拆 分 为
“ 新冠” 与“ 肺炎” 两个词。 为了避免受到非专业词
典的影响,防止专业名词被分割,新建词典文档加入
“ 新冠肺炎疫情” “ 区域全面经济伙伴关系协定” “ 中
国东盟自贸区” “ 联合国海洋公约” 等专业名词。
2.2.3 停用词处理
文本中的标点符号等冗余信息及语气词、副词、介
词等无意义的词汇会影响文档的主题提取效率,需要将
这些信息删除,最佳方式就是进行停用词处理。 四川大 图2 perplexity-topic 折线图
学等机构都整理了专门的停用词表,本文将四个通用停 3 研究结果
用词表加入自编程序对文本进行处理,处理过后日常用 主题模型的可视化结果如图 3 所示。 七个圆各
语中“在”“尚且”“人们”“得”“你”“故而”等字词将不 自代表七个主题,圆圈区域所占面积代表了每个主题
会出现在样本中,只保留有意义的实词。 在整个语料库中的重要性,而各个圆圈圆点间距的差
2.3 文本 TF -IDF 向量化处理 异则代表主题间的差异。 设置参数 λ = 1,与主题相关
利用词频 - 逆文本频率 ( Term Frequency – In⁃ 度最高的前三十个关键词会以降序形式出现在条形
39
2023 年 10 月 情报探索 第 10 期( 总 312 期)

图中,以主题 1 为例,最相关的关键词包含关系、交 流、主席、总理、国家、领域、会见等,如图 4 所示。

图3 主题间距离图

图4 主题 1 关键词条形图

40
2023 年 10 月 覃秋荣:基于 LDA 主题模型的中国国家形象研究 第 10 期( 总 312 期)

3.1 主题提取结果 资、中越边境贸易、农产品输华、国际关系探讨、旅游


运行模型后得到的主题没有名称,需要结合各 行业复苏七个主题名称。 主题提取结果如表 1 所
个主题的关键词和相应的逻辑关系进行命名。 最后 示,展示了 7 个主题和各个主题下相关性最高的前
抽象出两国外交活动、进出口贸易统计、中方贸易投 15 个关键词,以及每个主题的分布概率。
表1 主题-关键词表
主题 主题关键词 分布概率 / %
1 两国外交活动 关系、交流、主席、总理、国家、领域、会见、总书记、部长、会议、代表团、边境、共识、人民、建议 22.2
2 进出口贸易统计 市场、出口、企业、农产品、产品、水产品、出口额、进口、商品、进出口、总额、食品、出口量、生产、预计 15.4
3 中方贸易投资 投资、贸易、经济、企业、领域、项目、关系、伙伴、贸易额、双边、优势、疫情、地区、潜力、国家 15.1
4 中越边境贸易 活动、通关、国际、货物、边境、委员会、老街、管理、建设、博览会、街市、工作、跨境、进出口、人民 14.5
5 农产品输华 榴莲、出口、农业、农村、发展部、百香果、种植区、水果、红薯、代码、香蕉、议定书、正贸、面积、市场 13.3
6 国际关系探讨 总书记、和平、大使、关系、地区、海域、主权、国家、战略、社会主义、领导人、国际法、公约、海洋法、贡献 12.8
7 旅游行业复苏 旅游、游客、国际、航班、航线、市场、航空公司、国家、公司、文化、出境、旅游业、服务、人数、疫情 6.7

3.2 报道主题分析 情影响时,越南媒体还持续关注中方边境口岸的通


主题 1—两国外交活动的分布概率占比 22.2%, 关政策,以便越南企业采取相应行动确保顺利通关。
排名第一。 自越共中央总书记阮富仲于 2022 年 10 主题 5—农产品输华的分 布 概 率 占 比 13. 3%。
月 30 日至 11 月 1 日来华访问后,两国之间的外交 中国作为越南蔬果最大的出口市场,越通社多次报
活动更为频繁,越南媒体对相关事件的报道数量大 道越南农产品种植区获得中国海关总署签发的代码
幅增加。 越南媒体对中越双方外交活动的关注,反 或签署的议定书、越南多种农产品通过正贸渠道出
映出越南媒体重视中越双方的对话交流,以期在阮 口中国。 这反映出越南媒体紧盯中国农产品市场的
富仲访华后双方能有更全面、深入的沟通,并挖掘更 大门,在越南榴莲获得进入中国市场的“ 入场券” 后,
广的合作领域。 打造榴莲品牌与泰国、马来西亚竞争市场份额,也成
主题 2—进出口贸易统计的分布概率占比 15. 为了越南媒体反复强调的重点。
4%。 在越通社报道中,多篇报道以数据呈现的方式 主题 6—国际关系探讨的分布概率占比 12.8%。
指出越南与中方的贸易成果,如“ 五一假期间经老街 中方与越方在领海问题上一直存在争端,位于南海
口岸出口中国的农产品达 1 万余吨” “ 今年第一季 中的西沙群岛、 南沙群岛自古以来就是中国领土。
度,越南对中国的胡椒出口量约达 25 919 吨” 。 “ 中 越南媒体则多次报道称所谓“ 黄沙” “ 长沙” 属于越
国重新成为越南农林水产品出口最大市场” 。 越通 南主权,并反对我国颁布的南海休渔令,要求中国尊
社的相关报道反映越南媒体对中越双方的贸易往来 重越南主权。 越南媒体持续关注两国外交活动中对
持积极态度,并持续看好中方的经济市场。 相关问题的探讨及双边关系的走向,既想要捍卫所
主题 3—中方贸易投资的分布概率占比 15.1%。 谓“ 主权” ,又期望双边关系以“ 和平” 与“ 发展” 为主
越通社关注中方企业在越投资情况,报道自身的生 题。
产环境及已获中方投资,如“ 越南河内与中国苏州企 主题 7—旅游行业复苏的分布概率占比 6.7%。
业签署合作协议” “ 雅迪在越投资注册资金约 1 亿美 自 2023 年 1 月 8 日起,中国正式取消赴华人员入境
元” ,以吸引更多投资者目光。 同时,越南媒体的报 后全员核酸检测和集中隔离,停滞 3 年的旅游业复
道也反映越南政府对中国企业的重视,如“ 越南政府 苏,越南旅游业蓄势待发。 越南媒体持续关注中国
副总理会见中国比亚迪董事长” “ 越南政府副总理会 政府的相关政策并提醒国内旅游业积极筹备资源以
见中国舜宇集团董事长” ,以期达成更多经济合作, 迎接重新开放的中国市场。 在新冠疫情爆发前,中
引来更多投资项目。 国就是越南旅游业最大的客源市场。 越南媒体的关
主题 4—中越边境贸易的分布概率占比 14.5%。 注和报道反映了中国对于越南旅游业的重要意义以
越南与中国广西、云南接壤,与海南省隔海相望,出 及看好中国游客能够拉动越南经济带来巨大价值。
于地理位置的便利,越南与这几个省份的边境贸易 通过主题分析可以发现,2022 年 1 月至 2023 年
成为越南媒体的聚焦点。 中国 -东盟博览会、中国国 5 月,越通社涉华报道的主题包含政治与经济两大
际消费品博览会的开办对于越南而言是难得的经济 类,其中涉及政治类的是主题 1—两国外交活动与主
机遇。 因此,越南媒体格外关注边境贸易活动,受疫 题 6—国际关系探讨,分布概率共占 35%。 其余 5 个
41
2023 年 10 月 情报探索 第 10 期( 总 312 期)

主题均涉及经济类,分布概率共占 65%。 经济类主 系。 但在公共卫生事件影响之下,国际贸易受到严


题的分布概率远大于政治类主题。 值得注意的是, 重冲击,越南不得不重新把目光放到邻近的中国身
提取出的越通社涉华报道主题并不涉及中国文化。 上。 《 区域全面经济伙伴关系协定》 生效以来,给越
通过查阅语料库发现,在筛选过后的 337 篇报道中 南带来了更大的机会,与中国的合作能够带来更多
只有极少数报道涉及中越双方的文化交流,且重点 经济发展机遇。 越南官方媒体大量报道与中方的贸
在于谈论越方文化输出。 由此可知,越南官方媒体 易往来,构建起了中国的贸易大国形象,不仅能使越
报道的潜在话语一方面期望与中国有更多对话沟 南国内企业看到国际贸易受冲击下的发展出路,也
通,双边关系和平友好,但又警惕中国发展壮大会在 能使其他东南亚国家考虑与中国共同发展的机遇,
“ 南海争端” 等主权问题上对越南造成威胁。 另一方 这在一定程度上来说也给中国带来了积极影响。 除
面离不开中国带来的经济利益,期望进一步与中国 此之外,中国重新开放后,越南媒体大量报道为迎接
达成合作伙伴关系,在多领域招商引资,尤其重视越 中国游客做的准备,也表明了与中国不仅有贸易合
南农林水产品输华的全过程成功。 而文化类主题报 作的机会,还能在旅游行业拉动经济发展,逐步恢复
道的数量极少客观反映了越南官方媒体对中国文化 到疫情之前的状态。 这也给其他东南亚国家寻求与
在越传播的谨慎态度,主观上减少对中国文化的报 中国合作的方向提供思路。
道,也体现其有意减少中国文化影响力的意图。 3.3.3 文化“ 同化” 风险
3.3 报道潜在中国形象建构分析 越南文化在中国文化身上都有迹可循,越南从
3.3.1 大国崛起“ 威胁” 语言、文学、信仰、风俗、艺术、思想和政治制度上,都
中国与越南同为社会主义国家,作为邻国,中国 受到中国的强烈影响,在当代仍然保留了大量中国
的发展崛起使越南感受到了前所未有的危机感。 近 传统文化的痕迹。 同为东方文化却又深受中国文化
年来,越南的发展也越来越迅速,制造业突飞猛进。 影响,还曾长久作为中国的藩属国,越南对中国文化
中国的制造业同样稳居世界第一,两个毗邻的国家 的恫疑暗含了无法企及的自卑和担忧。 潜意识中的
快速发展,各类资源的争夺在所难免,冲突与竞争是 “ 文化自卑” 使越南在找寻自己文化身份时排斥影响
必然的。 虽然在阮富仲访华后,中越双方的关系拉 了自身千年的汉文化,甚至认为想要真正获得文化
近了不少,外交活动与经贸活动也更为频繁,但是越 独立,必须“ 去中国化” 。 越南媒体鲜少报道中国文
南对中国这个强大的邻国始终抱有疑惧的态度。 越 化就侧面建构了中国文化对越南文化存在“ 同化” 风
南媒体多次报道中方在南海的军事演习或其他活 险的国家形象,越南需要在与中国的文化差异中找
动、南海休渔令的发布等中国与越南关于主权的争 到自我肯定的价值,严防一切会被中国文化影响的
端。 在这类报道中,越南媒体的论调依然是谋求与 可能。 因此,在报道中越双方的文化交流时,越南媒
中国和平发展,将自己摆在谋和平的正确位置要求 体也重在强调越南文化,媒体的传播策略亦是避免
中国尊重越南主权暗暗抹黑中国,构建了中国 “ 威 中国文化的输入,注重越南文化的输出。 在越通社
胁” 越南主权、“ 恃强凌弱” 的国家形象。 虽然侧面 文化专栏中,能找到日本、 泰国等国文化的相关报
反映出越南对中国大国形象的认可,但也严重扭曲 道,却没有找到与中国文化相关的报道。
了中国形象,影响其余东南亚国家对中国的好感。 4 结语
除此之外,越南媒体还特别关注中国军事,通过报道 中国国家形象的“ 自塑” 与“ 他塑” 都是我们需
中国军事上的最近进展,潜在塑造中国是军事大国 要关注的重点,越南作为同制度的邻国,对其进行研
的“ 霸权国家” 形象,引发越南民众及东南亚国家对 究具有重要参考价值。 收集越南官方媒体对中国的
“ 中国威胁” 的担忧。 报道,并使用 LDA 主题模型发现报道潜在主题,可
3.3.2 经济发展机遇 以更好了解其如何塑造中国形象。 研究结果表明越
虽然越南官方媒体的报道偏向反映了对中国发 南官方媒体的报道潜在地塑造了中国既有大国崛起
展崛起从而威胁越南主权的警惕,但是从主题提取 “ 威胁” ,又有经济发展机遇,还有文化“ 同化” 风险
结果中不难看出,越南媒体仍然十分重视与中方贸 的形象。 这也启示了中国在对外传播时,面对不同
易往来带来的经济利益。 自越南加入世界贸易组织 类型的国家与民族,传播策略要有差异性与针对性,
后,成功走上了世界舞台, 与多国都建立了贸易关 争夺话语权的同时要注重如何讲好中国故事才能塑
42
2023 年 10 月 覃秋荣:基于 LDA 主题模型的中国国家形象研究 第 10 期( 总 312 期)

造真实立体的国家形象。 本研究仍存在一定局限 topic detection and tracking for online news texts[ J] . IEEE Ac⁃
性:首先,是样本选择,本文只选取了特定时段与特 cess,2019,7:58407-58418.

定媒体的报道来挖掘其隐含主题;其次,是对数据的 [5] 尹章池,刘凯恒. 公益组织大 V 微博动员的可视


化对比与策略跟进[ J] . 新闻与传播评论,2019,72( 5) :108-
处理不能尽善尽美,虽然利用 LDA 主题模型能够从
119.
文本中提取隐含主题,但是呈现出的是关键字词而
[6] 李振鹏,黄帅. 基于 LDA 主题模型的网络舆情研
不是观点的论述。 期望后续研究能够在此基础上进
究[ J] . 系统科学与数学,2020,40(3) :434-447.
行完善。 [7] 段淳林,吕笑. “ 一带一路” 国家品牌形象传播与
参考文献 主题模型计算的实证研究[ J] . 现代传播( 中国传媒大学学
[1] BLEI D M,NG A Y,JORDAN M I. Latent Dirichlet 报) ,2018,40(1) :64-69.
Allocation[ J] . The Journal of Machine Learning Research,2003, [8] 罗奕. 他者眼中的中国形象:基于东盟国家大众媒
3(3) :993-1022. 体涉华报道的舆情分析[ J] . 传媒,2019(14) :79-82.
[2] 张明慧,王红玲,周国栋. 基于 LDA 主题特征的自 [9] 李春霞. 越南官方媒体的中国认知变迁分析:以越
动文摘方法[ J] . 计算机应用与软件,2011,28( 10) :20 - 22, 南《 人民报》 ( 2000 ~ 2011) 为样本[ J] . 当代亚太,2012( 5) :
46. 97-120,159.
[3] 阮光册,夏磊. 基于共现分析的文本主题词聚类研 [10] 黄敏. 越南《 年轻人报》 报道中的中国形象:以
究[ J] . 图书馆杂志,2018,37(11) :99-104,119. 2010 年与 2011 年为例[ J] . 东南亚研究,2013(4) :4-16.
[4] XU G, MENG Y, CHEN Z, et al. Research on the

43

You might also like