论文部分内容阅读
军用信息的自动分类作为实现军用信息智能化处理的关键技术之一,是提高指挥效能必不可少的重要环节。本文研究并设计了军用信息的自动分类系统,其中包括:获取军用信息的训练集、建立军用信息的表示模型、确定军用信息的属性、选择军用信息分类模型和评估分类性能五个主要模块。本文主要完成了以下几个方面的创新工作: 1.通过对一般文本的表示模型的分析,并结合基于XML的军用信息的特点,对向量空间模型的权值计算方法进行了改进,并在预处理阶段提出了一种新的最大匹配分词算法。 2.针对原有互信息属性选择存在的偏向于低频词的问题,提出了一种改进的基于互信息的军用信息属性选择算法。 3.将反馈模块引入简单向量空间分类算法中,使得向量距离法和反馈方法相结合,从而大大提高了分类的精度。 4.综合了上述算法思想和模型,设计并实现了军用信息自动分类的软件系统,构建了军用信息的总体结构和分类体系,研究了各个模块之间的相互关系,同时对该系统的性能进行了测试和评估。