基于行为分析的垃圾邮件过滤算法研究与实现

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:ldd3663
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文从对垃圾邮件的行为分析入手,研究与实现了基于行为分析的垃圾邮件过滤技术。 在具体实现过程中,通过对垃圾邮件进行深入的分析和研究,建立相关行为特征分布模型,从而提取出垃圾邮件的特征。为了研究分析垃圾邮件的行为特征普遍性,对垃圾邮件的某些行为特征趋势进行一年的统计分析,得出较为普遍的垃圾邮件行为特征。为了便于行为识别算法的实现,建立行为特征的数学模型,将处理后的邮件数据集的行为特征进行量化。以开源数据挖掘系统WEKA为基础,实现基于决策树的过滤系统,对量化后的行为特征数据进行挖掘,得出影响最终决策的行为规则,利用行为规则实现对邮件的分类。 实验采用标准的邮件过滤性能测试方法,在TREC邮件数据集上的实验结果以及现实的邮件系统中的应用结果来看,基于行为分析的垃圾邮件过滤算法要比基于贝叶斯的bogo算法有较大,特别在垃圾邮件的误过率方面。
其他文献
植物克隆生长及其与生态适应性之间关系的研究是当今国际上植物种群生态学研究的热点和前沿课题,开展小半灌木克隆植物种群生态学的研究对于开拓和丰富该领域的科学研究具有极
狼(Canis lupus)属于食肉目、犬科、犬属。狼的生态适应能力很强,目前主要分布在东北、内蒙以及西藏人口密度较小的地区。目前对于狼的研究很少,尤其在其繁殖方面,这对于了解
摘要:目前,我们的学生课外阅读情况不容乐观,它表现的是一种社会现象,但却折射出青少年人生观存在的缺陷。因此,我们学校为青少年课外阅读提供一个良好的环境,让他们在充满书香和温馨的文化环境中健康成长,让健康向上的文化占领青少年的头脑。如果把他们仅仅禁锢在几门功课上,只会按标准答,只会就课本论课本,不爱读书,不能养成读书的好习惯,那么,可以说我们学校教育的根本任务并没有真正完成。我们教育工作者在积极实施
压缩图像的后处理技术指对解压缩后的图像进行处理,从而消除由于压缩而导致的各种失真,达到改善图像质量的目的。本文主要研究了静态压缩图像和视频序列图像的后处理技术。现
彩色CCD或CMOS图像包含的信息量大,内容更加丰富,对军事、航空航天、天文等领域的作用更是不言而喻,但是海量的数据传输负担成了空间彩色相机广泛应用的瓶颈,因而研究高效的图像