论文部分内容阅读
人工智能在21世纪得到了巨大的发展,自然语言理解作为人工智能领域内一门重要学科,越来越受到各国学者的关注,并得到了广泛的应用。语义分析作为自然语言理解的重要分支,也显现出了巨大的研究价值。本文在传统的中文语义分析的基础上,设计了以含权概念图作为知识表示方法和汉语语义库作为数据支持的中文语义分析系统原型。本文研究了中文语义分析系统原型的结构,模块功能以及语义分析准确率。在中文语义分析原型系统中,首先需要选择知识表示方法。概念图作为一种成熟的知识表示语言,经过多年的研究发展已经具有了很强的语义表示能力和知识推理能力。概念图的线性表示方式利于计算机储存及运算,本文在概念图的基础上,引入权值的概念构成含权概念图,并将其与语义相似度计算理论相结合,设计了基于含权概念图的中文语义分析系统原型。本文设计的中文语义分析系统原型包括中文分词,句法分析,概念图生成以及相似度计算四大部分。其中中文分词针对要分析的中文语句,利用层叠隐马尔可夫模型对中文语句进行词语切分。在完成词语切分后,在句法分析部分,利用依存句法分析的方法对中文语句进行句法分析,并将中文语句中各个词语间的句法关系标注出来。在概念图生成部分,总结常见的句法关系和语义关系,研究语法关系和语义关系之间的转换规律,利用语义库作为数据支持建立转换规则,将语法关系转换为语义关系,.最终将中文语句以概念图的形式表现出来。最后利用相似度计算理论,对概念图各个部分进行相似度匹配。并设计相应算法使计算机完成概念图的相似度匹配,最终达到语义分析的目的。在以上研究工作的基础上,本文构建了一个基于含权概念图的中文语义分析系统原型。该系统原型可以对中文语句进行分词处理,句法分析以及最终的相似度计算。本系统经过调试以及实验对比分析,中文语义匹配准确率达到50%,句型识别转换成功率达到了65%.针对中文信息存在的同形异义词和同义异形词相对传统的匹配方法有更高的准确率,达到了60%。