面向新闻领域的论元因果关系判断

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:cznay
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网时代导致了人们获得的资讯中存在大量冗余的或者无意义的信息,然而很多用户使用网络的目标是希望能够清晰的了解某一件事情的“因果”,避免浏览不相关或者重复信息。除此之外,用户希望可以从繁多的网页信息中快速准确的找到自己关心的“因果”信息。那么对文本中的“因果”相关任务探究便十分必要。本文对面向新闻领域的因果关系判断方法进行了探究,首先提出了基于句子成分的论元识别方法,在得到论元的基础上提出基于句法和语义信息融合的因果关系判断方法,最后构建出的因果知识库可用于信息检索和问答等多种应用中。首先,论元识别任务是需要从输入的自然语言语句中选择出可以表达关系的两个句子成分,这里所指句子成分为一段连续的、可以表达一个完成语义的文字序列。本文将输入句子进行句法树表示,采用子树提取算法获取候选论元,选择机器学习模型进行论元识别。本文将识别出的论元对用于因果关系判断。而本文所指的因果关系判断任务主要是判别输入的两个论元之间是否存在事实性的、明确的影响,是二分类任务。分析任务的特点之后可以看出除了论元序列本身的语义信息外,输入论元的句法结构信息对因果关系判断也有影响。因此本文从两个方面进行尝试:一个是基于句法与语义信息的因果判断,选择支持向量机模型并且使用由基本核函数和树核函数组合的复合核函数,抽取的样本特征包括词汇化特征、词向量语义特征和树形句法结构化特征。二是基于融合句法信息的卷积神经网络的因果关系判断,本文使用句法树表示输入论元,且将句法树上每个“词语”节点映射到词向量空间中,那么卷积神经网络模型中相应的卷积操作会选择树形卷积核完成,之后也将从树形窗口中选出数值最大的元素作为池化操作的输出。本文在对论元之间是否存在因果判断之后进行应用上的扩展,构建了因果知识库。因果知识库构建的关键任务就是因果对抽取,从抽取的输入和输出形式可以看出因果对抽取任务和序列标注任务有很大相似性。所以本文借鉴了序列标注任务思想,采用了条件随机场模型、循环神经网络模型、双向长短记忆神经网络模型已经条件随机场和双向长短记忆神经网络组合模型进行了因果对抽取实验方法探索。
其他文献
核磁共振成像是现阶段重要的临床医学成像方式之一,因其对患者诊断的精确性以及对人体无伤害性等优势,而得到广泛应用。然而,较长的数据采集时间是影响磁共振成像进一步发展
施肥施药是农业生产中的重要环节,目前我国的施肥施药机具存在作业精度差、肥药利用率低、作业效率低下和功能单一等问题,难以满足农业现代化需要。针对现存问题,本文提出一种将施肥与施药相结合的复式作业方式,设计了大宽幅对行施肥施药车,适用于行播作物的施肥施药,并试制了样机,进行了田间试验。(1)完成了大宽幅对行施肥施药车整机结构与关键部件设计,确定了施肥施药车的作业幅宽拓展、对行距离调节、作业高度调节、机
大规模多输入多输出(Multiple-Input Multiple-Output,MIMO)技术凭借其在频谱效率、能量效率和鲁棒性方面的明显优势而在无线通信领域被广泛使用。在实际的通信系统中,大规模
异构网(Heterogeneous Network,Het Nets)是5G的关键技术之一,提高了网络容量和数据速率,解决了传统小区覆盖盲区的问题,但是愈加复杂的干扰问题也随之而来,这会导致系统的性
图像恢复问题是数字图像处理中的一项重要研究内容,而彩色图像恢复问题又是图像恢复中的一个重要分支。彩色图像在计算机中,不同于二维的灰度图像,是具有三通道结构的图像,因
近年来,随着软件技术的蓬勃发展,软件系统及开发团队的规模也随之迅速增长,开发人员得到的待修复缺陷报告数量也成倍增加,加之开发人员很难完全了解整个软件系统的全部代码文
目的:1.通过实验研究对比 ALPPS(Asscoiating liver partition and portal vein ligation for staged hepatectomy),联合肝脏离断和门静脉结扎的二步肝切除)组与假手术组不同时间行二期肝切术术后大鼠存活率是否有差异性,其差异性是否具有统计学意义?2.收集联合肝脏离断和门静脉结扎一期术后不同时间点行二期肝切除术后SD大鼠的存活
显卡是个人电脑的重要组成部分,主要包括图形处理单元(Graphic Process Unit,GPU)以及内存单元GDDR5(Graphic Double Data Rate version 5),用来作为图形输出和并行计算使用
可重构计算技术已应用于众多高性能计算领域,如多媒体处理、无线通信、气象模拟、分子计算等,已成为未来高性能计算架构的重要发展方向[1]。然而当可重构计算应用于媒体处理
随着网络、信息技术和分布式计算机的飞速发展,越来越多的设备接入互联网,越来越多的信息在网络上共享,对设备和信息的网络管理问题以及安全的访问控制问题变得越来越重要。