基于多维度语义关联特征的网络舆情趋势预测研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:zhenzhurujun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的飞速发展,既孕育着机遇,又带来了挑战。一方面,许多网络社交媒介涌入人们的生活,如微信、微博、贴吧等,使得人们在发表自己的言论时不受时间空间的限制,互联网俨然成为了人们思想文化信息的集散地。另一方面,正是由于人们在互联网上发表的言论存在自由性强、受众面广、传播速度快和超越时空性等特点,为虚假违法消息的传播提供途径,容易导致舆情负面危机,互联网因此成为社会舆论的放大器。因此,如何用科学的方法预测网络舆情的发展趋势、并进行有效地引导,对保证国家安全和促进社会和谐有重要的意义。首先,传统的预测方法受技术和数据源限制,多数围绕网络舆情趋势的历史数据本身展开,通过对舆情趋势历史数据进行建模,探究其潜在规律从而达到对舆情未来趋势的变化预测的目的。然而这类预测方法只考虑了单一事件因素,忽视了同类事件对待预测事件舆情趋势的影响。实际生活中,相同或相似的主题、主体和情绪的事件会彼此关联,构成舆情事件群,同一个事件群内的事件往往发展趋势相近,待预测事件的发展趋势难免会受到关联事件的影响,引起自身舆情发展趋势的变化。基于这一现象本文提出了一种基于多维度语义关联特征的LSTM网络舆情趋势预测方法(MSA-LSTM),提取关联事件语义文本信息,计算主题、主体、情绪与待预测事件的关联度,得出多维度语义关联特征,与单一事件角度特征相结合,作为LSTM神经网络的输入,以此来对网络舆情趋势进行预测。实验结果证明,与基于时间序列和单一事件角度特征的LSTM网络舆情趋势预测方法相比,MSA-LSTM方法得到的预测结果可以更好地拟合舆情趋势的真实值,降低预测误差。接着,由于网络舆情事件存在众多不确定因素,使用LSTM模型进行预测会导致计算复杂度过高,参数量过大等问题,且在训练的过程中也容易出现梯度消失和过拟合现象。针对以上问题,首先,本文采用了一种相比LSTM参数更少更容易收敛的RNN拓展单元GRU来代替LSTM,解决了 LSTM算法复杂度过高,参数量过大的问题;其次,将SDZ方法应用于GRU单元,来对GRU的记忆单元进行概率化的更新,以保证正确信息在网络中向前和向后传递,提高预测准确率;再次,融入L1和L2范数相结合正则化方法约束神经网络中各单元输入权重;最后用softsign函数替代tanh激活函数,避免了梯度消失的问题。对此,本文提出了一种基于MSR-GRU网络舆情趋势预测方法,选择基于多维度语义关联特征的LSTM网络舆情趋势预测方法(MSA-LSTM)和基于多维度语义关联特征的GRU网络舆情趋势预测方法(MSA-GRU)作为对照实验,实验结果显示,MSA-LSTM和MSA-GRU预测方法在舆情趋势预测的问题上预测结果差别并不大,但MSR-GRU方法比MSA-LSTM、MSA-GRU的预测方法得到的舆情趋势更贴近真实值,误差更小,证明了该方法的有效性。
其他文献
智能交通系统可以监控道路状况,是当今交通发展的必然方向。而车辆检测在智能交通系统中有着重要作用,它可以检测车流量,从而为道路交通状况提供各种重要数据。由于航拍图像的背景环境比较复杂,目标比较小且数量较多,遮挡问题比较严重,给航拍车辆的检测带来了困难,所以如何在复杂的环境下提高车辆检测的精确度具有现实的意义。YOLOv4算法代表着目前业界最先进的物体检测水平,它的检测速度超过其他检测系统,实现了速度
目前,知识图谱已广泛应用于各个领域,在教育领域的应用和成就尤为显著,知识图谱在教育教学中扮演着越来越重要的角色。编程学习作为教育领域的一个重要分支,对于初学者来说,却仍存在诸多挑战,如学习周期普遍较长、缺乏有效的学习辅助手段并且在编程实践中难以及时的获得帮助等。这些挑战给编程初学者带来极大的不便,对于其知识的掌握和能力的提升都是不利的。基于上述内容,本文在分析编程语言学科特点的基础上,围绕着编程语
计算机信息技术发展日新月异,其开发应用百花齐放,深入各行各业。计算机视觉技术对图像和视频的处理水平也日趋成熟,尤其是人脸检测和识别技术发展迅猛,在人机交互、身份验证和视频安防等领域均有一定的研究成果。卷积神经网络是深度学习的代表算法,因其良好的鲁棒性和较高的准确率,广泛应用在目标检测和模式识别领域,逐渐成为工程应用的主流选择。人机交互技术使人与机器建立连接,实现机器为人提供更加优质的服务。这些技术
伴随着互联网的发展和普及,以MOOC为代表的在线学习已成为一种新型的学习方式。在新冠肺炎疫情期间实施的“停课不停学”活动,进一步推动了 MOOC学习的应用广度和深度。虽然MOOC学习具有不受时间空间限制、受众门槛低、学习资源丰富等优势,但也存在学习者被淹没在海量的资源中、难以找到符合自身需求的学习资源以及退课率高等诸多问题,所以如何为在线学习者提供个性化的资源服务是当前在线学习领域亟需解决的问题。
从工程领域到经济学领域,大量问题都存在多个需要优化的目标,而且各个目标之间相互制约、彼此冲突,此类问题被称为多目标优化问题(Multiobjective Optimization Problem,MOP)。与传统数学方法相比,进化多目标优化算法(Evolutionary Multiobjective Optimization Algorithm,EMOA)不需要了解问题的数学特性,而且在一次运行中
随着“互联网+”教育和智能技术的不断融合,智慧课堂场景下的多屏多点触控教学模式应运而生,教学内容及教学活动表现形式将更加丰富多彩。然而,以教师为主体的填鸭式教学模式将不适用于新时代背景下的师生互动关系,不利于教学效果的提升。为引导学生成为教学活动中的主体,掌握教学过程中的学生学习状态、感兴趣情况是非常有必要的。课堂学生注意力将能够客观真实地反映教学活动中学生的兴趣热点、知识盲区以及积极状态,是提高
单细胞RNA测序(scRNA-seq)技术是研究基因与表型之间的关系的利器,同时也是当前生物医学研究中最重要的技术之一。然而多种因素导致单细胞RNA测序数据中存在噪声,如Dropout现象等。这些噪声可能会阻碍单细胞测序的部分下游分析问题。为此研究人员提出多种计算方法用以填充或补全单细胞测序数据,以减少数据噪声。单细胞RNA测序数据会因为Dropout现象等原因导致测序数据矩阵具有极高的稀疏性,针
随着我国大学入学人数的逐年递增,高校教学质量受到了社会各界人士的广泛关注;而学业成绩作为衡量学生一段时间学习成效的重要指标,成为评价高校教育水准的重要指标之一。同时,各高校借着物联网、云计算和大数据迅猛发展的东风,纷纷建立了数字化校园环境。在此进程中,海量学生行为数据在校园内生成并不断积累。这些数据涵盖了学生日常学习和生活的全过程,不仅是研究人员当下关注的重点,也受到了高校管理人员的关注。但在实际
《:塑料成型工艺与模具设计》是模具与机电相关专业的必修课程,其课程思政教学改革是专业建设的重要内容,也是人才培养的重要环节,针对该课程内容庞杂、系统性和实践性强的特点,通过发掘课程蕴涵的“思政元素”,对《塑料成型工艺与模具设计》的课程思政教学进行有益的探索,并取得较好的教学效果。
《1000以内数的认识》是学生在认识了100以内数的基础上教学的,旨在认识"千位"及其计数单位——"千",初步建立四位数的整数数位顺序,进一步体会相邻单位之间的十进制关系,并在此过程中有意识地培养学生的数感。这是教材第一次正式介绍"比100大的数",对于二年级学生来说,在生活中其实已普遍接触过,且绝大多数学生会读会写即将要学的"1000以内的数"。在这样的学情下,加之"数的认识"本身又有些枯
期刊