【摘 要】
:
词义消歧在自然语言处理领域中是一个重要的研究问题。歧义词汇在不同的上下文中具有不同的含义。词义消歧是指采用一定的策略或算法自动确定歧义词语义的过程。词义消歧在搜
论文部分内容阅读
词义消歧在自然语言处理领域中是一个重要的研究问题。歧义词汇在不同的上下文中具有不同的含义。词义消歧是指采用一定的策略或算法自动确定歧义词语义的过程。词义消歧在搜索引擎、机器翻译和文本理解中具有重要的应用。本文通过对词义消歧知识和深度学习模型的研究,结合卷积神经网络(Convolution Neural Network,CNN)模型和贝叶斯模型,提出了一种半监督的词义消歧方法。利用训练语料来优化贝叶斯分类器和CNN分类器,结合半监督方法对无标注语料进行语义分类。将具有相同语义分类结果的语料加入训练语料中,并优化这两个词义消歧分类器。不断重复这一过程直到获得优化后的CNN分类器。在本文中主要对以下三个方面作了介绍和研究:其一,详细介绍了词义消歧的研究内容和意义,以及国内外的研究现状和发展。根据当前各个应用领域的现状,分析了词义消歧技术面临的难题和未来发展趋势。其二,详细介绍了实验中需要的语料库和《同义词词林》,并对语言学知识进行了分析,确定了消歧特征的提取过程。对语料库的背景和数据进行了说明,介绍了语料的预处理过程。详细地说明了利用贝叶斯分类器、BP神经网络分类器和CNN分类器进行消歧的过程。其三,结合贝叶斯分类器和CNN分类器利用半监督方法进行词义消歧。利用训练语料来优化贝叶斯分类器和CNN分类器。使用两个优化后的分类器对无标注语料进行语义分类。若两个分类器对句子的语义分类结果一致,则将其加入训练语料中。重复这一过程,不断地优化贝叶斯分类器和CNN分类器。利用优化后的CNN分类器来对测试语料中的歧义词汇进行消歧,并对消歧结果进行了测试。实验结果表明:本文所提出方法的消歧效果要好于贝叶斯分类器和CNN分类器。
其他文献
石英毛细管结构简单、成本低且具有天然的空芯圆对称结构,因此易于与光纤集成形成各种级联结构,是实现光纤传感器的重要载体。基于石英毛细管的传感器件主要包含法珀(Fabry-P
目标检测是计算机视觉领域中的重要基础研究,是图像内容理解问题的重要基础。随着机器视觉技术的深入研究,通过各种智能算法对图像中的目标进行准确识别和精确定位。但是在雾
申威系列处理器是采用自主指令集且具有完全自主知识产权的国产通用处理器,已经成功应用在超级计算机、高性能服务器、存储系统、网络安全等多个领域。LLVM作为开源编译框架
伴着控制技术的不断进步,轮式移动机器人越来越多地应用于智能交通、家居服务、工业生产等领域。近几年,视觉传感器凭借其低成本和获取图像信息无需接触测量等特点,与智能化
电阻点焊作为一种重要的焊接方法,广泛应用于航空航天、汽车、五金、电子及医疗器械等多个领域。近年来,随着器件、设备的小型化,微型零件的电阻点焊的应用越来越多。微型零
政党制度是一个国家各政党参与政权的制度性规范,体现了各政党在国家政权与社会结构中的地位作用、相互关系、运作方式、实现形式等。改革开放以来,关于政党制度理论的研究日益兴盛。随着政治、经济、社会环境的变迁,特别是政党、政府及社会关系的变化,关于政党制度概念内涵的界定在不同时期也有所不同,代表性观点有“体制说”“制度说”“综合说”等。探究政党制度概念内涵的理论逻辑,理清概念发展的历史脉络和实践效果,有助于在国内外政党制度的实际对比中,凸现中国政党制度的鲜明特色和显著优势。
红外成像系统依据目标物体自身发出的热辐射信息成像,使所获取的红外图像能够显示出具有高热辐射量的场景信息,而低热辐射量的场景信息会在背景热辐射中湮灭。近年来,红外成
目标检测对物体进行识别和定位,在视频监控、智能机器人、自动驾驶等视觉应用系统中承担着对场景进行基础建模的重要作用。由于深度学习的引入,基于静态图像的目标检测算法有
针对图像识别问题,传统的深度学习方法往往需要对整个输入图像进行编码,无法有选择性的重点关注关键信息部分,且对数据集的要求较高,不仅需要人工对数据集进行加标签的工作,
20世纪末以来,在全球化和技术革新的双重作用下,更新企业的竞争优势取代了持续竞争优势成为企业长足发展的前提(Corbett,et al.,2013)。认识到更新企业竞争优势的需要使得管