论文部分内容阅读
词义消歧是自然语言处理中的难点问题,为提高消歧效果,提出一种基于多节点组合特征的词义消歧方法。根据依存语法理论,选择歧义词的祖父+父亲+孩子节点组合,并将其作为消歧特征。利用模糊C均值聚类算法,建立消歧模型,最终确定歧义词词义类别。采用哈工大信息检索研究中心语言技术平台的词义语料进行实验。实验结果表明,相比现有的两种方法,该方法不仅使特征维度平均值分别降低了5和25,且F1值分别提高了1.56个百分点和0.84个百分点,在一定程度上提升了词义消歧效果。