【摘 要】
:
理解文本中描述的事件对于许多人工智能(AI)应用至关重要,例如话语理解,意图识别和对话生成。其中脚本事件预测是这项工作中最具挑战性的任务。脚本事件预测也可以叫做剧本事件预测,这项任务是来自手工编码任务的子任务。其中手工编码任务起源于1970-80年代,最早是作为文本知识骨干而使用,让推理和其他需要利用文本中深层语义知识信息的NLP任务成为了可能,如故事生成、对话理解、文本推测等任务提供了基础。完成
论文部分内容阅读
理解文本中描述的事件对于许多人工智能(AI)应用至关重要,例如话语理解,意图识别和对话生成。其中脚本事件预测是这项工作中最具挑战性的任务。脚本事件预测也可以叫做剧本事件预测,这项任务是来自手工编码任务的子任务。其中手工编码任务起源于1970-80年代,最早是作为文本知识骨干而使用,让推理和其他需要利用文本中深层语义知识信息的NLP任务成为了可能,如故事生成、对话理解、文本推测等任务提供了基础。完成剧本事件预测的主要工作可以分为三部分:第一部分是从文本中依照规则抽取定义上的剧本事件;第二步是将剧本事件变成计算机可以理解的表达方式;第三部分是指定剧本事件预测模型和评估方法。细化成技术方面,完成剧本事件预测任务的主要步骤分为:数据清洗、依赖分析、实体分析、抽取事件、获取事件链、构建预测模型、评估模型,这七个部分。由于构建预测模型的好坏、优劣决定了整个流程是否能充分掌握文本中事件的语义信息,因此本文的工作重点在于第六部分构建预测模型和第七部分评估模型这两部分。本文的主要内容是针对剧本事件预测任务中,事件预处理的事件表达这一环节进行了更加深度的工作。主要贡献是在事件的向量表示处理这一步,针对事件元组中多义词对事件的含义影响以及无法包含事件之间稠密信息这两个问题,提出了采用上下文事件生成剧本事件的向量形式,对任务准确度有一定的提升。最后在前人的工作基础上,进行了模型准确度对比,分别和PMI模型、和Bigram模型、以及长短时记忆网络+Attention机制模型对比了模型的准确度。此外还做了横向对比实验,研究了事件元组中包含的依赖元素种类对于任务准确度的影响。综上,根据实验发现真正影响实验最后结果的是事件中的动词或者动词词组,而事件中存在的依赖元素,对结果的影响是较小的。另外,更深层的事件表达向量代替处理时间序列的神经网络中的事件向量,提升了结果精准度。
其他文献
<正>全面深化医改,增进群众健康福祉。2018年是福建省卫生计生向卫生健康转变的重要一年。一年来,全省卫生健康系统认真贯彻落实国家卫生健康委和省委、省政府的工作部署,群
网络广告是一面民主、理性、信息化的旗帜广告。这样的广告将把用户带到另一个网址。这种非强迫性传播的特性,使网络广告成为迄今为止最“民主”的一种广告类型。1999年第46
分别于2017年10月和2018年6月对渭河流域内12个采样点的浮游动物种类、物种密度、生物量和水温、电导率、溶解氧浓度和pH等水质指标进行调查,并利用生物多样性指数法对水质进
长期以来,航天系统从研制为主,缺少批生产的实践和经验。如何面对市场经济和未来战争的需要,实现我国航天武器型号从多研制少生产向研制与批生产并重的转移,是航天系统必须认
本文对上海地铁无线CBTC车地无线通信系统所采用的技术制式、组网方式做了归纳总结,给出了FHSS与OFDM两种主要体制的电磁干扰测试结果,重点分析了两种体制抗干扰主要机理及优
运用数据包络分析(Data Envelopment Analysis DEA)理论对中国各地区的旅游业进行效率与规模收益分析,研究表明:地区间的效率差距明显、各地旅游业的规模效益是递增的、旅游
随着品牌竞争时期的到来,整个市场处于供大于求的买方市场状态。产品或服务的同质化程度越来越高,差异性越来越小,特别是核心功能的差别几乎为零。品牌标志时期已过渡为品牌
目前,中小企业网络组织在中小企业发展过程中已经成为提高竞争力和成功率的有效组织形式。但是,在经济发展中每一种新形式都有自身的优势,企业应根据自身特点和外部环境变化,
文中主要研究瑞利平衰落信道下量化噪声对最大比合并(MRC)接收分集合并输出信噪比的影响。文中推导了量化噪声与信道噪声、信道参数之间的数学关系。仿真结果阐明量化对分集
通过对冷却水塔节能潜力和节能技术的分析,在其上加装冷却水温度控制系统和隔声降噪装置。可预先设定冷却水温度,当水温在预设温度以上时电动机则工作,反之电动机则停止工作,这样