论文部分内容阅读
在信息量飞速膨胀的今天,全球每天产生海量的信息,其中多达90%都是非结构化信息,这部分信息的大量存在和难以利用使得人们多年来在统一格式和改进算法投入了大量研究。XML作为一种半结构化语言受到了重视和发展,并越来越多的作为新型信息载体,本文提出一种对XML非结构化信息的模式识别和信息分类方法,通过将本体领域思想和认知语言学词典思想引入到模式识别中,建立一个树形的分层识别系统的结构框架。