基于深度学习和词典定义的义原预测研究

来源 :战略支援部队信息工程大学 | 被引量 : 1次 | 上传用户:oikikukka
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
义原是人类语言中不可再分的最小语义单元,在自然语言处理领域的多种任务中起到重要作用。知网HowNet是一个典型的义原知识库,是由语言学家历时多年经过手工标注构建起来的,已得到广泛应用。随着社会发展,语言中的词汇和语义不断发生变化,靠人工标注更新义原知识库的的方法费时费力,且存在标注一致性的问题。义原的自动预测成为知识库建设的一项重要任务,而当前的义原预测技术仍然存在很多问题。影响义原预测效果的因素包括所使用的模型是否合适,是否引入更多的信息或知识,若引入知识则能否充分提取特征,由特征到义原的映射过程是否合理,以及能否解决多义词和低频词等疑难问题。现有研究方法对上述问题没能很好的解决。针对义原自动预测面临的挑战,本文提出了两种基于深度学习技术的利用词典定义进行义原预测的解决方案。一是利用基于注意力机制的编码器实现义原预测,二是提出基于局部语义相关性的义原预测方法,实验证明本文提出的方法在义原预测任务中能够取得目前最好的效果。同时,本文还通过反向词典这样一个义原预测的下游任务来进一步验证所提出的方法的实用性和有效性。主要工作和贡献如下:(1)利用基于注意力机制的编码器实现义原预测。现有的义原预测方法大都未结合丰富的知识信息,或者对知识的利用很不充分。词典定义是一种标准的语义描述,而现有利用定义进行义原预测的方法存在很多不足,为了解决定义信息挖掘的充分性问题,本文结合注意力机制改进了编码器,并通过融合多种信息进一步优化义原预测模型,有效提升了义原预测效果。(2)基于局部语义相关性的义原预测方法研究。利用编码器的方法挖掘定义信息,提取的语义特征是一个有限维度的向量,所包含的信息量十分有限。通过研究定义中的词与目标词和义原之间的关系,发现具有局部语义相关的性质,基于该性质提出了一种新的义原预测方法。该方法不但有效提升义原预测效果,对于低频词和多义词等预测难点也能很好的解决。(3)利用义原预测方法实现并改进反向词典系统。本文提出的两种义原预测方法可有效应用于反向词典任务,并通过引入义原等知识进一步改善效果。作为首个汉语界的反向词典系统也具有一定的社会意义。通过实验证明了本文提出的方法在义原预测任务中具有明显的提升效果和良好的鲁棒性,并通过反向词典任务进一步体现了本研究的实用价值,同时也证明了义原知识的重要作用。开展义原自动预测研究在人工智能领域具有广泛的应用价值和较深远的现实意义。
其他文献
封闭差动行星轮系分多条路径传递功率,传递功率大、结构紧凑,广泛应用于舰船等大功率场合。但封闭差动行星轮系功率流路径较多,结构复杂,若结构设计不合理,会使系统内部出现
2型糖尿病在我国的发病率逐年增高,成为严重危害人民健康的一类疾病,但是其具体的发病机制目前并不清楚。脂多糖(LPS)是革兰氏阴性细菌细胞壁的主要成分结构之一,也是革兰氏阴性细菌的主要致病因子,无论是动物实验还是人体研究均表明,LPS作为一种抗原,可以激活免疫系统,与非糖尿病个体相比,2型糖尿病患者体内LPS水平增高。胰高糖素样肽(GLP-1)是目前应用较为广泛的一类降糖药物,除了经典的降糖作用机制
[摘要] 目的 利用超声检查,使胰体远端及胰尾部显示更清晰,从而及早发现此部位的病灶,提高病灶检出率。 方法 对239例受检者(均为我院门诊就诊患者),先进行常规平卧位胰腺扫查,对胰体尾显示不满意的人员再进行右侧卧位扫查,并进行对比分析,观察胰体远端及尾部显示清晰程度,并做记录、总结。 结果 239例中平卧位检查胰体远端及胰尾显示清晰192例,占80.3%,结合右侧卧位检查显示清晰共213例,占8
迈进21世纪,在全球经济与科技发展多元化的趋势下,经济体系间的隔阂与冲突逐渐模糊,人们正在迈向一个竞争与合作关系并存的时代."闭门造车"的生产模式只能蒙蔽自己的眼睛,使
科学工程领域诸多问题都可以通过建立微分方程模型来描述,其中部分问题表现为高阶微分方程。求解微分方程的数值方法有很多,本文主要在全局化配点法与分片多项式配点法基础上
自中国经济进入新常态以来,各项重要指标运行出现较大偏离,经济增速由高速变为中高速。2008年金融危机以后,在出口和投资对经济增长的贡献率都减弱的情况下,消费成为拉动经济