论文部分内容阅读
语义排歧研究是自然语言处理领域的热门话题,而情态动词研究是语言学领域里具有相当历史性而且很重要的研究方向。因此,利用自然语言处理的方法研究情态动词的语义是一个跨学科的研究,而且具有重要的意义。本文采用语义排歧方法来探讨情态动词must的语义问题。本文采用语料库定性定量相结合的研究方法和朴素贝叶斯有导语义排歧方法,以Coates(1983)对情态动词的研究成果为基础进一步探讨了如下两个问题:第一,不同语言特征对情态动词must的语义影响如何;第二,哪些语言特征相组合能产生最佳排歧效果。本文的创新点可体现在如下几个方面:第一,实现了朴素贝叶斯方法对情态动词must的语义排歧,使得语义排歧研究突破了目前大多只排歧名词、动词、形容词等语义比较简单的词的局限,从而使语义排歧研究迈进到了情态动词层面;第二,通过间接性的使用互信息(MI)值,使得互信息(MI)值这个重要的语言特征能在朴素贝叶斯排歧方法中发挥作用;第三,语言特征选择过程中条件互信息的使用,使得本文结论更具有科学性。实验结果显示,不同语言特征对情态动词must的语义影响程度也不同,按影响程度由大到小的顺序排列为:情态动词后动词的完成体;情态动词后动词的静动性,施事性;情态动词和其后动词之间的互信息MI;主语人称;情态动词后动词的语态,情态动词的肯定否定,主语的有无生命性。其中,情态动词后动词的静动性和施事性对情态动词must的语义影响程度相当。情态动词后动词的语态,情态动词的肯定否定及主语的有无生命性对情态动词must的语义几乎没有影响。当互信息值MI,情态动词后动词的完成体,动词的静动性,动词的施事性和主语人称相组合用朴素贝叶斯方法排歧时,排歧效果最佳,100个测试语句的排歧正确率达到91%。此外,本文通过实验证实了Harry Zhang和Ludmila I. Kuncheva等人的观点,即条件独立性假设并不是朴素贝叶斯语义排歧方法达到最佳排歧效果的充分必要条件。