【摘 要】
:
槽填充(Slot Filling)旨在从大规模语料中抽取目标实体的属性信息。该研究包含两方面关键任务:1)源信息(相关文档)获取,其任务是根据目标实体及给定的参考文档从大规模语料中
论文部分内容阅读
槽填充(Slot Filling)旨在从大规模语料中抽取目标实体的属性信息。该研究包含两方面关键任务:1)源信息(相关文档)获取,其任务是根据目标实体及给定的参考文档从大规模语料中检索相关文档,这类文档不仅是潜在包含目标实体属性的文字载体,也提供了重要的上下文信息,因此被认定为属性抽取的源信息;2)属性抽取与检验,其任务是从相关文档中抽取目标实体的候选属性值,并对候选值的确切性进行检验,从而形成可靠的结果予以输出。本文针对上述两项任务一并开展研究,将语义信息与实体关联性信息共同应用于源信息获取,并尝试独立应用于属性抽取环节,形成了一套集检索和抽取技术的槽填充模型。总体上,本文研究内容包括如下三项:1)基于实体监督和主题模型的文档检索方法:本文基于检索框架构建源信息获取模型,侧重解决命名实体歧义性造成的相关文档获取的误差问题。本文提出一种联合了主题语义和实体群落的检索方法,并利用伪相关反馈实现了实体查询表示的重构。在检索过程中,本文利用神经网络模型将主题语义和实体群落特征联合应用于的相关度的计算环节。实验表明,该方法有效地提升文件检索的性能(F1值提升了6.4%)。2)基于注意力机制的卷积神经网络实体关系分类:本文针对相关文档内的句子进行逐条处理,旨在利用分类模型识别其中特定属性的候选值。然而,待分类语句往往存在多种语义关系,误导目标实体与候选属性值的语义关系分类。针对这一问题,本文提出一种基于注意力机制的卷积神经网络实体关系分类模型,利用注意力机制,将紧密相关于目标实体的语义信息给与更高的关注度,借以优化上述关系分类模型。实验表明,该方法获得比目前实体关系分类模型更好的性能(F1值提升了2.94%)。3)基于实体群落的无监督实体属性过滤方法:借助关系分类策略进行目标实体属性的识别,有助于发现属性值的多种文字表示形式,但其中往往包含冗余和错误的属性,现有研究已尝试借助置信度估计进行冗余与错误属性值的过滤,但性能尚存在较大缺口。针对该问题,本文提出基于实体群落的无监督实体属性过滤方法。利用层次聚类生成多个实体属性值群落,然后利用实体图模型挖掘与目标实体相关的群落,以实体群落为依据,过滤错误的实体属性值。实验表明,该方法能够有效提升槽填充系统的性能(F1值提升了6.8%)。
其他文献
目的:本研究通过对多巴丝肼联合普拉克索治疗帕金森病(Parkinson’s disease,PD)的随机对照试验进行Meta分析,系统评价多巴丝肼联合普拉克索治疗帕金森病的有效性与安全性。
铁路通信空中接口监测时需要存储大量空口数据以便重现干扰,这势必带来巨大的存储资源消耗,因此,对空口数据进行压缩有助于降低存储压力。而一些常用的压缩算法应用于铁路空口数据压缩时压缩率不高,设计一种适用于铁路空口数据的压缩算法是极其必要的。本文首先验证分析了哈夫曼编码和LZMA等常见压缩算法、LEC算法在铁路空口数据压缩中的应用性能,讨论了数据精度对各算法压缩率的影响;在此基础上,设计实现了波形字典压
智能语音助手是一种以语音交互技术为核心,通过语义分析将服务结果反馈给用户的应用,能够帮助用户解决不同场景的问题。相较于传统的交互方式,智能语音助手不再受到操作界面
目前液力缓速器的仿真计算大部分只局限于稳态流场数值仿真计算,并且对缓速器瞬态充液制动起效过程的预测方法难以考虑充放液阀系流动状态的影响,导致计算充液时间与测试相比
高放废料深地质处置是现阶段安全处理高放废料最现实可行的方法,在深部地质层复杂的水文地质环境下,气体渗透性是评价围岩及岩石-混凝土屏障结构安全性的重要物理参数,因此本文对花岗岩-砂浆界面在不同湿度条件(干燥,18%,43%,89%)下的气体渗透性和其它相关物理参数进行了试验研究。本文以花岗岩、砂浆以及含有二者交界面的组合试样作为研究对象,从试样基本的物理力学参数(密度及孔隙率、比表面积、孔径大小与分
本文考虑到GF(3)上线性组合系数可以不全为1,从而借助此线性组合模型更深入地探索有限域上序列的性质。与以往相比,新的序列由双向输出变为双向线性组合输出并且组合系数更好
现今中国迎来了重塑形象、增强国际话语权的历史机遇期。由于中国对世界的影响更加全面和深刻,世界各国都对中国给予了广泛而深刻的关注。为回应世界范围的广泛关注,《习近平谈治国理政》谈中国、论世界,为各国读者开启了一扇观察和感知中国的窗口。自2014年向海内外发行以来,《习近平谈治国理政》收到了国内外的广泛好评,已被译成21个语种、24个版本,发行至全球100多个国家和地区,发行量突破625万册。《习近平
本文主要基于过渡金属氧化物具有优异的电催化性能,以过渡金属材料为原料,通过调控表面活性剂合成前驱体。后期利用水热合成的方式成功制备出不同形貌的过渡金属氧化物:海胆状的CoO_x(OH)_(2(1-x))-Sn(Ⅳ),花状的NiFe_2O_4和β-CoHSi超薄纳米片。具体研究内容分别为:采用传统水热合成方法合成球状的CoSn(OH)_6前驱体,随后经过加入硫源及水热合成方法处理前驱体。制得微观结构
基于生物电信号的人机交互系统通过神经信号解码技术在人与智能设备之间建立了一种方便、自然、鲁棒的交互方式。为了比肩和超过鼠标、键盘、操作杆等传统交互方式,新式人机
乌东德水电站是我国“西电东送”战略骨干电源之一,是在全面建成小康社会决胜阶段开工建设的“大国重器”,对推动长江经济带发展、优化我国能源结构调整、促进美丽中国建设、