论文部分内容阅读
随着智能工厂概念的提出以及智能产品的不断涌现,传统机械制造行业正逐渐向智能化方向发展。在智能机械产品需求分析中,不可避免地出现大量的歧义字段,而自然语言理解作为人与计算机的通信桥梁,如果不能对这些歧义字段以及句子结构进行正确的识别,将会导致机器不能执行正确的指令。本文针对自然语言理解中存在的方位词歧义字段的识别问题,构建了一种基于统计与规则的方位词消歧模型,并将其应用于智能机械设计领域中。 首先,从整体上阐述了自然语言理解的概况以及歧义处理的研究现状,针对自然语言理解中方位词引起的歧义现象进行分析。根据方位词歧义的表现形式,从是否跟介词组成远距离搭配结构以及歧义字段类型的角度分析,把方位词的歧义现象分为四类,其中,重点对介词跟方位词歧义字段构成远距离搭配的类型进行深入研究。 其次,提出了基于统计与规则的方位词消歧方法。通过运用双向最大匹配以及互信息等方法对方位词歧义字段进行统计,建立了基于哈希存储算法的方位词歧义字段词典;通过对歧义字段所处的句子结构信息以及歧义字段紧邻字的性质进行分析,制定了相应的消歧规则,并构建了方位词消歧规则库。然后,在基于统计方法的分词模块基础上,引入了基于规则的方位词消歧模块,建立了基于统计与规则相结合的方位词消歧模型。通过对该模型进行实验,结果表明本文所采用的方法对方位词歧义字段处理效果有一定的提升。 最后,将基于统计与规则的方位词消歧模型应用于智能机械产品设计领域中,用于解决机械产品需求分析中因对方位词识别错误而引起的知识获取错误的问题,使得机器能够更好地理解用户的需求。