论文部分内容阅读
利用基于概率统计方法的贝叶斯算法,对报文内容分析系统中的垃圾信息进行过滤.该算法的实现,是通过一定的算法来分析大量的相关信息和不相关信息中多种单词特征出现的概率,从而建立一张单词特征表,并依据这张表借助一个评分系统来判断目标文件的相关性.本算法具有一定的自适应性,能根据垃圾信息不断变化出现的形式自动进行特征表更新,从而不断地实时提高本身的判断效率.