轻量级可解释谣言检测方法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:bigfish
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web2.0和移动互联网的快速发展为人们提供了方便快捷的信息交流平台,但也降低了谣言的传播成本,提高了谣言的传播速度,对于自动化的谣言检测算法的需求越来越迫切。传统的按照时间序列组织划分谣言,再使用深度模型编码谣言的检测算法丢失了谣言的结构信息。最近的工作提出基于递归神经网络或图卷积网络等深度模型综合编码谣言的文本和结构,有效提升了谣言检测算法的性能。但当前的基于深度模型的谣言检测算法存在以下不足:(1)已有的基于深度模型的谣言检测模型结构复杂,效率低,不够轻量化,难以应对大规模谣言检测的要求。(2)基于深度模型的谣言检测算法在性能上取得了巨大突破,但是并不能为性能提高提供理论上的解释,算法缺乏可解释性。针对上述问题,本文主要研究工作如下:(1)提出了一种基于谣言传播路径编码谣言文本,并基于路径表示增强得到谣言表示的谣言检测算法PPA。该方法首先根据数据集构建谣言的传播结构树,再基于谣言的传播树提取谣言传播路径,以传播路径为基本编码单元而非树节点;其次,PPA模型基于传播路径的属性对路径进行筛选,并使用轻量级模型编码传播路径;最后,在得到谣言传播路径表示的基础上,基于最大池化得到谣言传播结构树的表示并用于分类。在三个公开数据集上的实验表明:文本提出的模型PPA取得了和已有复杂模型相当的优异性能,但是更加轻量化。(2)提出了一种基于神经主题模型增强谣言传播路径表示的谣言检测算法PPA-WAE。该模型首先基于谣言的传播结构树构建无标签的回复路径文本数据集;再引入神经主题模型,基于回复路径文本数据集预训练神经主题模型,分析回复路径中蕴含的情感主题的分布;预训练好神经主题模型后,使用神经主题模型的编码器编码得到回复路径的表示,再联合PPA模型共同训练,进一步提升谣言检测的性能。在四个公开数据集上的实验表明:文本提出的PPA-WAE模型在性能上优于已有的复杂模型,且可以从文本主题的角度对谣言检测性能的提升给出解释,提高了谣言检测算法的可解释性。论文实现的源代码和数据已被公开在https://github.com/zperfet/Path Fake Git。
其他文献
随着我国地铁建设的快速发展,愈发需要自动化地铁隧道巡检手段保证日常巡检的频率和效果。中小型地铁隧道巡检车具有自带动力、搬运方便、操作简单等优势,是实现地铁隧道自动巡检的较优选择。本文针对中小型巡检车设计了一套自动化程度较高的控制系统,选定控制硬件并设计了相应安装结构,设计了走行控制、实时定位和安全预警三方面的控制算法,实现了各模块的控制软件程序,使巡检车能够搭载巡检人员和检测设备安全完成巡检任务。
运用薄片观察、测录井数据以及试油试采数据,明确大牛地气田上古生界石炭系太2段优质储层的控制因素,利用建模软件petrel和测井数据反演实现不同粒度岩相累积厚度和不同成岩相累积厚度的平面分布预测,结合储层含气性分布,总结出优质储层的分布规律。研究表明:致密气优质储层分布呈现"岩相控制优质储层分带性"和"成岩相主导区带内优质储层再分布"的特点。溶解成岩相和发育于粗粒岩相中的钙质胶结交代成岩相控制高产气
本文报道一例有阿司匹林加重性呼吸系统疾病病史的患者,出现嗜酸性粒细胞性肠炎及复发性急性胰腺炎。此病例有多系统受累的临床表现及嗜酸性粒细胞浸润的组织学表现,故临床疑诊为嗜酸性肉芽肿性多血管炎,而此病出现胰腺炎表现的病例报道少见。另外,患者出现胰腺假性囊肿,在囊肿穿刺引流后出现迟发假性动脉瘤出血,经血管造影栓塞治疗后成功止血,术后1年复查病情稳定。在诊断和处理的过程中有许多值得学习之处,故在此报导。
近些年,随着人类的科技不断发展与进步,人工智能已经深入人们的生活。人们生活中遇到的很多问题都是博弈问题,如何使用人工智能高效的解决生活中的博弈问题成为了众多学术研究问题之一。根据当前主体观测到的信息完全与否,可将博弈问题分为完备信息博弈和非完备信息博弈。目前已经有很多研究者针对完备信息博弈进行研究,然而在实际应用场景中大部分遇到的博弈问题都是非完备信息博弈,因此针对非完备信息博弈的研究具有重大的意
本文针对航空航天中异形构件复合材料铺放中存在的铺放头自重大、异形构件结构复杂等问题,开展铺放方案以及铺放并联机构的研究。提出了一种新型2-UPU&R(2-R(RR&RPR)R)并联机构作为铺放头的位姿调整平台,并对其进行理论分析和尺寸优化,构建新型并联机构的虚拟样机模型,进行仿真分析,并制作实验样机进行实验验证。论文为最终的异形构件铺放的结构配置提供了技术支持,具有重要的研究意义,对此进行以下的研
在线社交网络的出现彻底改变了信息的传播方式,深刻地影响着整个社会的信息传播机制,并极大地促进了网络中信息的产生与传播。在线内容的流行度是用户注意力聚集的体现,能够反映信息的扩散范围和受关注程度。准确地预测在线内容的流行度具有重要的理论价值及广阔的应用前景,目前已经受到学术领域和企业的共同关注。然而,在线内容流行度差异性以及各种复杂因素给预测带来一系列挑战。已有的流行度预测研究主要分为三类:基于特征
货物重心偏离对行李车的运行安全性有很大的影响。行李车加挂在旅客列车上进行运输,要保证旅客的安全,就必须对行李车运输安全的限制条件进行明确的规定。用铁路车辆装运货物要求符合相关运输条件和技术规定,但目前缺乏适用于行李车的装载技术条件相关规定和文件。由于行李车车内行李间、转向架悬挂特性和技术性能等特点,《铁路货物装载加固规则》中的相关规定不能直接套用在行李车运输上。要进行现场试验,制定行李车装载技术条
在计算机视觉和模式识别等领域,相似性度量是衡量样本特征向量相似程度的最基本的方法。如何有效地利用先验信息学习一个好的相似性度量函数,已成为目前研究热点之一。当前,学者们已经提出了众多的度量学习算法,通过最小化类内距离、最大化类间距离学习度量矩阵。其中基于马氏距离的度量学习算法是最常用的。但在实际复杂的应用场景下,现有度量学习算法仍然存在缺乏全局信息和局部信息的融合,噪声环境下的不鲁棒等问题。针对这
无人驾驶汽车的横、纵向控制系统是保证无人汽车安全行驶的核心部分之一。不同于有人驾驶的汽车,无人汽车需要更先进的横、纵向控制算法来保障汽车能够准确跟踪决策规划模块给定的期望信号。针对以上问题,本文设计并实现了一个无人驾驶汽车的横、纵向控制系统。主要工作及创新点如下:首先,过去大多数研究人员运用简化或者部分建模的方法来对汽车整车建模。不同于这种方法,将Carsim软件中的整车模型作为被控对象,更接近汽