【摘 要】
:
人工智能领域中机器阅读理解是自然语言处理(Natural Language Processing,NLP)方向的核心研究任务之一,其研究目标是让机器阅读原文之后,能够正确的回答与原文内容相关的问
论文部分内容阅读
人工智能领域中机器阅读理解是自然语言处理(Natural Language Processing,NLP)方向的核心研究任务之一,其研究目标是让机器阅读原文之后,能够正确的回答与原文内容相关的问题。提高机器对文本阅读理解的正确率,可以促进机器翻译的准确度,信息检索的精准度,问答(Question Answer,QA)等NLP任务的研究,与此同时,文本特征的表示方式对机器做阅读理解的正确率也有一定的影响,所以文本特征表示和机器阅读理正确率提升的研究是一个很有实际应用价值的研究。为此,本文描述了文本特征处理过程,改进了2016年Mahmoud Nabil论文中对文本特征的表示方式,对于英文中带有“’”的单词,原来将其分成两个单词来对待的不合理的方式改为恢复补全缩写词.同时,将填充词用于待移除高低频的占位方式改为用另外一个词来代替,原来的填充词只做填充之用。在文本特征数值化后,不改变原有文本特征顺序的前提下,做到真正完全移除高低频词;在模型融合阶段,使用了已训练的词向量或位置词向量表征文本的语法和语义信息,同时基于现有的经典神经网络模型搭建系统融合需要的各个子模型。最后选取正确率高于65%的11个子模型进行软投票和硬投票的融合方式进行模型融合来提升机器阅读理解的正确率。最终,在训练数据上使用不同结构的子模型运行后进行模型融合对机器阅读理解任务表现性能的提升效果做出对比与分析。结果发现,完全移除高低频词后,模型预测效果有一定提升。而使用模型结构差异比较大的多个子模型进行融合,融合后的结果明显会比在单个子模型上融合效果要好。
其他文献
20 0 3年 8月末举行的六方会谈及此后的形势发展表明朝鲜核问题的国际协调机制已发生根本变化 ,朝鲜核问题不久将迎来重要的转折时期。本文对朝鲜核问题的基本认识、北京三方
目的用电针结合手法按摩治疗各型颈椎病,评价其疗效。方法应用电针结合手法按摩治疗310例各型颈椎病。结果本组310例,其中优254例,占81.93%;良32例,占10.32%;可19例,占6.13%;
职业价值观是人们对职业行为产生直接影响的社会判断取向,而成就动机是个体克服困难、努力取得满意结果的倾向,它受到个人职业价值观的影响。专业承诺表现为学生对专业课程的认可和接受态度,它也会受到职业价值观以及成就动机的影响.据统计,2016年我国中职院校在校生人数约1599万人,超过高中在校学生人数的三分之二。由于学生年龄、专业和职业化中职教育的独特性,往往表现出中职学生不同的职业心理特征,如何对中职学
<正> 各省、自治区、直辖市、计划单列市、"优化资本结构"试点城市国有资产管理局(办公室):为做好城市"优化资本结构"改革试点中的国有资产管理工作,加强国有资本金的管理,探
<正> 国发[1994]39号各省、自治区、直辖市人民政府,国务院各部委、各直属机构:《中国教育改革和发展纲要》(中发[1993]3号,以下简称《纲要》)是90年代乃至下世纪初教育改革
目的主要研究中医药在气阴两虚型晚期非小细胞肺癌化疗中的应用。方法本文从病因病机、辨证分型及中医药在气阴两虚型晚期化疗中的临床应用进行综述。结果中医学以其整体观念
<正> 第九届全国人民代表大会常务委员会第二十九次会议决定:批准于2000年5月25日经联合国大会通过、同年9月6日我国政府签署的《<儿童权利公约>关于买卖儿童、儿童卖淫和儿
2007年是东盟成立40周年,它被誉为是世界上除欧盟外最成功的地区组织,取得了令人瞩目的成就。随着世界和地区形势的发展与变化,东盟未来发展面临许多挑战,为此东盟已采取了应
近年来,应用于医疗监护领域的可穿戴设备凭借其独特的便携性与实时性越来越多地出现在了人们的日常生活中,但是市面上适用于工人穿戴的体征参数监测设备还很少。而在高强度工作状态下的工人普遍对其身体状况缺乏足够的认识,由此导致工人会突发重病甚至死亡,因此对工人的健康监护又显得格外重要。基于以上事实,本文设计了一套可以实时监测工人血氧饱和度、心率和呼吸率等数据的体征参数采集装置,手机通过蓝牙接收数据并在相应的