论文部分内容阅读
构建一个全唐诗语料库是使用计算机自动研究唐诗的基础。在对唐诗中的"词"、"复合词"等进行系统定义的基础上,综合唐诗在格律方面的特点,提出一种适用于唐诗诗句分词的方法。该方法先依据唐诗格律特点对诗句进行切分,对不符合词定义的切分结果,再采用现代汉语分词技术中最大逆向匹配算法进行修正。实验结果表明,所提出的方法能有效提高唐诗分词准确率。