【摘 要】
:
垃圾邮件已经成为互联网的一大公害,这些邮件在占据邮件服务器大量存储空间的同时,传播各种有害信息,给社会和个人造成了巨大的危害。因此,研究邮件智能过滤具有重要意义。以
论文部分内容阅读
垃圾邮件已经成为互联网的一大公害,这些邮件在占据邮件服务器大量存储空间的同时,传播各种有害信息,给社会和个人造成了巨大的危害。因此,研究邮件智能过滤具有重要意义。以前的垃圾邮件过滤技术一般包括白名单和黑名单技术、规则匹配以及基于规则评分的过滤技术等。 本文使用机器学习理论,讨论了用文本分类的方法来过滤垃圾邮件。由于垃圾邮件过滤不能简单等同于文本分类,把合法邮件判为垃圾邮件是不可接受的,所以垃圾邮件过滤中的精确率十分重要。本文从基于统计方法的垃圾邮件过滤理论着手,重点研究了Bayesian分类器中关于特征概率计算和邮件联合概率的计算问题,以提高垃圾邮件过滤的精确度。 本文主要内容如下: 1)介绍了垃圾邮件的概念,分析了垃圾邮件的危害和当前的发展状况; 2)回顾了反垃圾邮件技术的发展,对各种技术进行了对比和评价: 3)介绍了现行的电子邮件系统结构,从电子邮件系统的结构出发,分析了垃圾邮件过滤的策略; 4)讨论了用文本分类的方法过滤垃圾邮件和贝叶斯理论,并介绍了相关的文本特征提取理论和垃圾邮件过滤的评价体系: 5)深入研究了垃圾邮件过滤中的统计理论,对特征概率计算和邮件联合概率计算的几种方法进行了详细的比较,研究和改进; 6)设计并实现了一个基于统计学习理论的客户端垃圾邮件过滤器:SpamFilter
其他文献
在文件共享应用领域,非结构化P2P系统由于其简洁性和健壮性取得了巨大的成功。但是,非结构化P2P系统的扩展性问题制约了其快速发展。 本文以Gnutella为例,研究了非结构化P2P
随着网络管理协议的日益完善和嵌入式设备在互联网中的广泛应用,以及嵌入式设备在网络应用中表现出的强大优势,使得“嵌入式”网络时代的来临成为必然。然而,由于嵌入式设备
传统的视频点播系统主要使用客户/服务器模式,服务器以单播的方式与每个客户建立连接。由于流媒体服务具有高带宽、持续时间长等特点,随着客户数目的快速增加,服务器将成为系统
众所周知,当今世界是一个知识化的时代,越来越多的人们已经了解到知识的重要性,他们希望能掌握更多的知识以求在未来的竞争中获得更多的优势。一般而言,从知识是否能够用语言直接表达和有效转移的属性来看,可以将知识分为外显知识和内隐知识两种类型。而知识社群作为将内隐知识转化为外显知识的一种很好的机制也越来越多的为更多的企业及研究人员所接受。 在这种情况下,如果能够通过知识社群对员工进行综合评估,就可以
本文对构建eLearning环境中的方法与技术进行了研究。文章针对现有eLearning应用的局限性,提出了利用基于Web服务的SOA扩展eLearning应用,并通过SmartClient作为服务整合的客户
针对当前工作流系统存在的各种问题:柔性差、鲁棒性差、标准化程度差、互操作性差等,本文以某公司科研项目管理为课题背景,结合现代企业分布性、网络化、与原有系统集成等新特点
本文阐述了移动平台即时通讯技术以及国内外研究现状,分析了移动平台即时通讯的前景。介绍了即时通讯技术基于的Jabber/XMPP协议的原理,基于Jabber/XMPP协议提出总体设计,重点论
随着计算机网络和多媒体技术的迅猛发展,Internet上的Web应用一直呈爆炸式的增长,其中绝大部分是HTTP请求服务。由于HTTP请求的增长的过快,导致许多的网站的Web服务器面临超载的
工程三视图是以正投影原理在三个正交平面上的正投影来表达三维零件结构和形状的一种有效手段。当前机械零件设计领域仍以二维图纸设计为主,而三维形体不仅有完整的几何拓扑信
随着互联网的发展和普及,全球化成为商业软件获得成功的关键因素。随着软件业的发展,软件全球化的支持也在不断得到加强。出现了各种辅助应用软件进行全球化开发的标准和类库