论文部分内容阅读
本文经过借鉴维吾尔语自身特点和前人的研究成果,针对维吾尔语的句法、词法分析等方面进行了较深入的研究。经过分析其他语言在短语识别方面的经验和算法,参考维吾尔语在传统语言学和信息处理方面的研究状况,发现维吾尔语短语的自动识别方面仍然存在缺欠,这也是在维吾尔语本体研究以及维吾尔语自然语言信息处理领域中需要解决的重要科学问题。本文是以新疆师范大学网络信息安全与舆情分析实验室提供的小学维吾尔语文教材语料为研究对象开展研究。在新疆师范大学网络信息安全与舆情分析实验室的支持和帮助下,本人准备了已标注的小学维吾尔文语文教材电子语料库。了解维吾尔语短语研究概况的同时,从传统语言学角度出发,理解维吾尔语短语、分短语原则,考察维吾尔语短语特点和构造短语特征,因而从语法角度对维吾尔语短语进行分类。本人研究维吾尔语短语的相关特点,分析短语跟句子、单词的关系,从中归纳出一系列语法规则,并为下一步工作打下基础。探索短语识别方面的算法,分析维吾尔语短语的相关概念,从中得到一系列短语自动识别的规则并构建短语识别规则库。基于词典与规则相结合的方法,设计与实现人机交互的维吾尔语短语识别系统,并构建小学维吾尔语文教材短语库和规则库,初步解决维吾尔语短语识别问题。构建一定规模的维吾尔语短语规则库和短语语料库的同时,设计与实现人机交互的维吾尔语短语识别系统,取得了一定的成果。将维吾尔语短语的自动识别工作信息化,这将在提高短语的结构分析、短语分类,短语统计效率和句法分析的可信度等方面发挥积极的作用。本成果将在后续机器翻译、自动问答、信息检索、文本分类等一系列相关智能软件的开发和应用方面具有非常重要的研究意义和参考价值。