论文部分内容阅读
朴素贝叶斯分类器在基于内容的垃圾邮件过滤研究和实用系统中有广泛应用,取得了很好的效果。常用的朴素贝叶斯模型有两种:多变量贝努利模型和多项式模型。本文使用中文和英文公开邮件语料对比了分别基于多变量贝努利模型和多项式模型的垃圾邮件过滤器的性能,实验结果证明基于多变量贝努利模型的过滤器性能更好。本文还对这两种模型在文本分类任务和邮件过滤任务中的差异进行了分析,多变量贝努利模型更适用垃圾邮件过滤任务。