论文部分内容阅读
目前,电子邮件已成为人们生活中便捷的通信手段之一,但是垃圾邮件的泛滥耗费了大量的网络资源,造成了严重的社会问题。当前的垃圾邮件过滤技术不同程度地存在缺陷,比如训练时间长或对突然的变化反应不敏感等。人工免疫系统(AIS)具备强大的识别、学习和记忆的能力,它的自体/非自体识别能力正是识别垃圾电子邮件良好而又天然的解决方法,灵敏的免疫反馈机制为识别变化多端的垃圾邮件提供了解决之道。本文介绍了人工免疫系统原理及其产生背景与相关研究,对当前的垃圾邮件过滤技术进行了分析,指出了这些技术存在的问题,进而讨论了人工免疫原理用于垃圾邮件过滤的合理性。在研究现有免疫算法的基础上,针对当前算法中存在的问题,提出了AISEC的改进算法模型DAICA。该模型采用虚拟基因库技术,对AISEC的抗体更新过程进行改进,确保抗体更新时能充分利用参与分类的抗体的信息,从而保持先前抗原的信息,并通过实验在标准UCI数据集上验证了该改进算法的有效性,同时对算法中涉及到的参数进行了详细的分析讨论。在深入研究危险理论的基础上,设计了一个基于危险模式的动态垃圾邮件过滤模型—DTDEF,给出了该模型的基本架构及其具体实现算法,该算法在进行垃圾邮件过滤时充分体现出动态性、学习的自适应性和分类的有效性等特点。最后,针对DTDEF算法,本文采用实际生活中采集到的真实数据进行实验,并与经典的Bayes算法进行比较分析,结果发现基于危险理论的DTDEF算法在不同的更新周期下大部分时间均优于Bayes方法,尤其当更新周期为1时,性能远远高于Bayes方法。