论文部分内容阅读
Web 2.0以及移动互联网技术的快速发展,使得各类新兴的社会化媒体成为用户信息获取、传播、分享以及好友间交流沟通的主要平台。社会化媒体集合了情报收集与信息扩散两大功能,并兼具社交性、实时性、内容主导等特点,成为当今人们了解突发公共事件的重要渠道。但由于事件发生与政府介入处理存在一定时间差、民众的应对能力与客观事实不平衡等原因,导致社会化媒体也成为网络谣言滋生的温床,从而对社会经济及公共秩序造成负面影响,例如“2011年日本核辐射泄露事件”导致民众哄抢碘盐、“2014年禽流感事件”导致家禽大幅降价,以及“2016年山东非法疫苗事件”带来群体性的疫苗恐慌等。以上事件严重扰乱了正常的社会秩序,极大地考验着政府部门的社会治理能力和危机应对能力。因此,深入揭示突发公共事件背景下社会化媒体谣言的传播演化机理,并给出有效的谣言控制策略,不仅是网络平台管理者和政府相关部门亟待解决的现实问题,也是信息系统、应急管理等研究领域要解决的关键科学问题之一。为此,本文从宏观层面上的谣言传播特征,以及微观层面上的谣言传播行为预测两个维度,基于国内社会化媒体平台,对突发公共事件中的谣言传播机制进行研究。在谣言传播特征方面,本文选取了 2016年“山东非法疫苗事件”、及2019年“米脂三中伤人事件”为典型案例,构建谣言传播特征数据集,分别对谣言传播级联与非谣言传播级联的传播深度、传播规模、结构性病毒指数、传播宽度以及传播周期等特征指标,进行了深入分析。分析结果表明:1)与国外社会化媒体中的谣言传播特征不同,在国内社会化媒体平台中,传播规模大、持续时间长、传播宽度或传播深度大的谣言传播级联比例较少;2)相较非谣言信息,谣言整体传播的规模较小、持续时间较短,但各谣言传播级联的传播特征分布比较平均;3)超大规模或超小规模的非谣言传播级联比例较大,而一般规模的谣言传播级联比例较大,说明谣言在事件发生早期有较大的发展潜力,环境因素对谣言传播影响较大。此外,现有研究显示舆情传播的级联规模与用户平台影响力有关,且谣言级联的早期传播规模较大,可能与谣言信息发出者的构成有关,而非谣言内容所致。因此,本研究爬取了各舆情级联起始节点的用户特征数据,发现除较少被平台认证外,谣言与非谣言发出者的平均使用水平相似。以上结果表明,突发公共事件爆发后,谣言与非谣言信息将同时在平台出现,社会化媒体用户很难通过信息发出者的用户特征,辨别信息真伪,其传播行为更有可能与自身传播习惯有关,且在谣言传播行为相关性分析结果中进一步识别了微博频率以及反应时间两个影响传播行为的关键因素。在谣言传播行为方面,本文基于卷积神经网络(Convolutional Neural Networks,CNN),构建了基于用户历史舆情文本、谣言关注度、微博频率、反应时间的谣言传播行为预测模型——R-CNN模型,以对突发公共事件中社会化媒体用户的谣言传播行为进行预测。该模型利用搜狗语料训练的word2vec词典,对用户历史舆情文本,进行词向量构建,以增强短文本上下文联系。此外,考虑到现有模型存在定性变量与定量变量割裂的问题,本文在构建的模型中,同时引入了文本和定量向量,以从多个角度量化用户行为指标。本文选取经微博平台认证的两个谣言传播级联,作为研究样本,构建谣言传播行为数据集,以分别对构建的社会化媒体用户谣言传播行为预测模型进实验验证。实验结果表明:1)本文构建的谣言传播行为预测模型,其预测精度达到88%;2)与传统的TF-IDF算法相比,利用搜狗语料训练的word2vec词典构建词向量,可将模型的预测精度提升4%;3)与仅以词向量作为特征向量相比,引入定量向量后的模型,其预测精度提高了 6%。此外,本文将该模型与支持向量机(Support Vector Machine,SVM)、逻辑回归(Logistics Regression,LR)等经典的预测模型进行了比较。实验结果表明,本文建立的基于R-CNN的谣言传播行为预测模型,充分利用了预测系统的降维能力,并避免了人工建立关注度指标的偏差问题,因此与其他模型相比,其预测精度平均提高了 7%。