论文部分内容阅读
传统计算语言学的种种理论和方法,都以语料统计为基础。但是,只靠统计概率是不能统摄复杂多变的语言现象的,因此还需要结合语言规则,进行句法和语义的分析。
依存语法是上个世纪末刚刚兴起的一种形式语法理论。由于依存语法直接刻划词与词之间的关系,不使用词性和短语类型标记,形式简洁、精炼,冗余信息少,被很快应用到机器翻译、信息检索、语音识别等各个领域。
本文提出了以规则生成依存语法句法树的思想。以词性为基础,系统总结出了句子中词性之间依存关系规则库。并根据规则、依存语法和汉语本身的特点提出了句法分析的算法。最后得到依存语法句法树,该句法树是一个有向无环的平面图。
另外,本文还根据汉语的特点,将配价语法中“价”的观点引入系统,在很多方面都解决了由于规则产生的语义上的一些歧义。这使得依据规则的方法在依存语法句法分析中取得了成功。