论文部分内容阅读
自动分词是彝文信息处理中一项不可缺少的基础性工作,彝文信息处理只要涉及到检索、翻译、校对等,就需要以词为基本单位.根据彝文的特点,介绍了彝文分词规范与分词词表的设计,提出了实现基于既定词表的彝文自动分词技术的算法选择、系统结构,以及实现流程;而且进行了抽样测试,其分词准确率和速度都比较令人满意.最后结合彝文的特点对实现彝文自动分词的难点进行了分析.