基于ARTMAP神经网络的垃圾邮件过滤研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:zhoushuoqd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网广泛普及的今天,电子邮件已经成为人们进行信息交互的重要工具之一。它在给人们带来极大便利的同时,也给人们带来了造成很大困扰的副产品——垃圾邮件。为了解决垃圾邮件带来的问题,人们在技术和法律方面都进行了不断的努力,垃圾邮件已经得到了一定的控制。当前,垃圾邮件过滤的主要技术包括白名单与黑名单技术、规则过滤、基于关键词匹配的内容扫描、以及基于内容的文本分类方法等。目前的垃圾邮件过滤系统如基于BP神经网络的过滤方法,已经取得了很好的效果,准确率得到了很大的提升,但由于BP神经网络本身存在局部极小点,收敛速度和可塑性都有待提高,这在一定程度上影响了邮件过滤的效果。基于ARTMAP神经网络的垃圾邮件过滤是一种基于内容的文本分类方法,将ARTMAP神经网络应用于垃圾邮件过滤是一个新的研究方向,可以提高过滤网络的收敛速度和可塑性,并能防止网络陷入局部极小点。本文介绍了垃圾邮件的定义,探讨了垃圾邮件的危害,分析并总结了当前主要的垃圾邮件过滤技术,对常用邮件分类方法的基本原理及分类准确率进行了介绍。在此基础上,本文提出了基于ARTMAP神经网络的垃圾邮件过滤系统,并介绍了ARTMAP过滤器的过滤模型及其工作流程。之后,使用Ling-Spam语料集进行分析对比实验,实验证明,ARTMAP垃圾邮件过滤器更符合垃圾邮件特征不断变化的现实环境,提高了过滤器的性能,其准确率和查全率也分别达到了99.01%和99.50%。并且在性能上对ARTMAP神经网络和BP神经网络进行了比较,实验证明,ARTMAP神经网络不存在局部极小点,具有可塑性,并且收敛速度比BP神经网络快。本文的贡献主要有以下两个方面:1.在性能上对ARTMAP神经网络和BP神经网络进行了比较。实验证明,ARTMAP神经网络不存在局部极小点,具有可塑性,并且收敛速度也比BP神经网络要快,这种神经网络能够更好的适应垃圾邮件特征不断变化的环境。2.构造ARTMAP过滤器对垃圾邮件进行过滤。ARTMAP过滤器采用ARTMAP神经网络对已经预处理过的邮件文本进行分类,一类为垃圾邮件类,另一类为合法邮件类。实验证明,ARTMAP垃圾邮件过滤器更符合垃圾邮件特征不断变化的现实环境,提高了过滤器的性能,其准确率和查全率也分别达到了99.01%和99.50%。
其他文献
随着后基因组时代的到来,生物信息学的研究重心已经从序列的测序转移到对已测序的全基因组进行功能注释。随着大规模测序工具的高速发展,大通量的全基因组得到测序。仅仅依靠
本文实现了基于J2ME的手机即时通信系统,系统客户端和服务器通信使用的是Http协议,对Http协议的特性作了简要描述,结合本系统的使用,分析了Http协议的内部操作流程。设计了本系统
数据挖掘是研究从大量数据中发现有用知识的理论与方法,它是目前国际上数据库和信息决策领域的最前沿研究方向之一。关联规则是数据挖掘中一个较早的、有意义的研究课题之一。
伴随大数据时代的到来,人们每天面临着海量数字信息,信息过载问题日益严重。传统的获取信息的方式是传统的门户网站和通过搜索引擎主动搜索,这已经不能及时满足人们对有效信
随着软件产品在整个社会中的作用越来越重要,公司在生产和交付软件产品及服务上的竞争进一步加剧,使得在短时间内有效地开发出高质量的软件成为必须。其中,测试是保证软件质
当今,我们可以从网络上获取大量的数据与服务来满足人们对知识的需求。语义Web的出现为知识工程、数据工程提供了上下文环境,它帮助我们改善了网络上的知识组织,并使用户更加
随着数字媒体产业的高速发展,近年来,在国内动漫产业正日益成为一个巨大的产业。媒体技术的发展给动画带来巨大的发展机遇,无论从电影到电视还是互联网、移动通讯,我们正处在媒体
无线传感器网络是集信息采集、信息传输。信息处理于一体的综合智能信息系统,在环境监测、医疗卫生、智能家居、国防军事等方面会有极大的应用。无线传感器网络是一项重要的
可信计算组织认为隐私保护是可信系统的一个必要因素,用户对自己的隐私信息必须拥有选择和控制权,为此可信计算组织于2004年发布了DAA方案来保证证过程的匿名性和解决Privacy
集成了传感器、微机电系统和网络三大技术而形成的传感器网络是一种全新的信息获取和处理技术,其目的就是协作地感知、采集和处理网络覆盖区域中感知对象的信息,并发送给观察