论文部分内容阅读
随着社交网络的快速发展,社会舆论热点事件备受网民关注。网民积极的参与社会舆论热点事件的讨论,加快了网络舆情的传播与扩散。网络舆情事件中蕴含丰富的信息,有效的对其进行管理及分析有助于掌握网络舆情态势。已有的网络舆情事件研究分析不够细致且深度不足,主要存在如下两个方面的问题:(1)网络舆情事件信息组织多是采用关系型数据库存储并管理,导致查询检索困难,无法高效地对网络舆情事件进行直观地可视化展示及推理分析;(2)基于网络舆情事件的传播与扩散分析多是采用仿真建模的方法,理论复杂,操作困难。解决这些问题的核心在于改进网络舆情事件的存储和表示方式,并在此基础上对网络舆情事件进行传播分析和扩散预测。知识图谱作为以图模型为基础的新型数据表示和存储工具,能够有效解决或改善以上问题。本文研究网络舆情事件知识图谱构建技术及应用,主要研究成果如下:(1)研究了实体消歧方法。针对传统的实体消歧方法中词向量语义表达能力弱以及未考虑实体的局部特征等问题,本文提出一种基于上下文词向量和主题模型的实体消歧方法。首先,在传统词向量模型上增加上下文语序向量,训练上下文词向量;其次,分别计算上下文相似度、类别主题相似度以及主题相似度;最后,融合三种相似度,选择相似度最高的实体作为最终消歧实体。实验结果表明,新方法优于现有的主流消歧方法。(2)研究了知识表示与推理方法。针对基于神经网络的知识表示与推理方法忽略邻居实体丰富信息等问题,本文提出了基于图衰减注意力网络的知识表示与推理方法。首先,引入衰减注意力机制,为不同关系路径上的关系分配不同的关系权重,将其与图注意力网络结合,设计了图衰减注意力网络;其次,基于该网络,分别对关系和实体进行嵌入表示,并挖掘三元组的隐含特征;最后,基于实体和关系的嵌入表示,分别进行链接预测、关系预测与三元组分类任务,完成知识推理。实验结果表明,该方法较基于神经网络的主流知识表示与推理方法取得了更好的性能。(3)研究了网络舆情事件传播与扩散分析方法。针对基于仿真推演的网络舆情传播与扩散分析方法存在的理论复杂,操作困难等问题,本文提出了基于知识图谱的网络舆情事件传播与扩散分析方法。首先,构建网络舆情事件知识图谱;其次,基于知识图谱计算用户影响力,挖掘意见领袖;然后,根据传播学的二级传播理论,构建基于二级传播理论的网络舆情事件传播模型,刻画网络舆情传播规律、周期与途径;最后,以网络舆情事件知识图谱中存储的三元组知识为数据源,设计基于知识推理的网络舆情事件扩散预测技术,通过链接预测、关系预测与三元组分类等三个步骤,实现网络舆情事件扩散预测。实验结果表明,该方法能够有效计算用户影响力,进而可以挖掘意见领袖,较好地对网络舆情事件进行传播分析和扩散预测。