基于K最邻近的标签传播模型检测图像型垃圾邮件的研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:programmelove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络信息技术的日益普及和迅速发展,使用电子邮件进行交流,极大地满足了人与人之间的通信需求。但是,垃圾邮件作为互联网中具有争议的副产品,也愈演愈烈,尤其是图像型垃圾邮件(Image Spam),它不仅严重地浪费了资源,而且可能会阻塞和瘫痪网络,影响用户之间的正常沟通。因此,开发高效率的Image Spam检测技术是社会迫切需要的。论文介绍了Image Spam检测技术的背景、目的和意义,阐述了Image Spam的定义、特征、构造方法、检测难点,分析了比较常用的Image Spam检测方法,并指出了这些方法的优势与不足,从而提出了基于K最邻近的标签传播模型(K-Labels Propagation Model,KLPM)的Image Spam检测方法。论文的主要工作和贡献是:(1)提出了基于牛顿(Newton)稀疏表示的方法来消除图像的噪声:利用Newton法处理小波变换后的系数,使系数稀疏化。该方法能够在消除图像噪声产生影响的同时,尽可能多地保留图像的细节,从而提高检测方法的精度。(2)提出了利用SURF算法来提取图像的尺度和旋转不变特征。该算法对图像旋转、仿射变换、尺度缩放等图像的变化都能保持一定的不变性和可区分性。(3)提出了改进的均值聚类算法来聚类图像的特征,构成特征向量,计算图像之间的相似性,保证了图像之间的可比性。(4)提出了标签传播模型分类器,基本思想是:将每幅图像视为一个节点,并打上标签,通过在完全连接图上传播标签,从而对测试图像进行分类。并在此基础上,改进了该分类器,从而设计了基于KLPM的Image Spam检测方法,基本思想是:先通过基于Newton稀疏法的消噪模型来预处理图像,再获取图像聚类中心点信息;然后提取所有图像的加速鲁棒性特征描述符信息,进行均值聚类;最后采用KLPM检测Image Spam。此外,通过实验比较了多种方法,证实了论文方法具有较好的分类效果。
其他文献
随着IT领域网络化、智能化以及快速的全球化发展,网络安全越来越成为炙手可热的研究课题。在诸多重要的网络安全的应用,如漏洞挖掘、模糊测试、入侵检测等,首先理解协议的语
1病例简介患者女性,24岁。尾骨角处间歇性疼痛6年,因卧硬板床加剧3d来我院就诊。体格检查:尾骨角下缘见一骨性隆起,局部压痛明显,皮肤轻度红肿。无特殊病史,其他检查未见阳性
<正>【教学目标】1.知识目标:通过情景设问与提出问题理解商品的含义和基本属性,借助情景体验领悟货币产生的过程及货币的本质。2.能力目标:(1)增强学生正确判断商品和货币的
思想政治课的教学效益与作业反馈的有效性密切相关。如何进行作业评价和反馈才能让学生愿意并乐于完成作业,从而提高教学效益,这是本文探讨的主题。在明确作业反馈的目标后,
能力立意在2014年高考文综新课标卷(Ⅰ)政治试题中得到了体现。分析湖南考生答题情况,发现考生在完成第13题时表现出较低的能力水平,即获取和解读信息、调动和运用知识、描述
近几年来,越来越多的谈判发生在人们身边,而通常谈判不是一个人进行,而是由双方的谈判团队进行博弈。国内的研究大多数集中于谈判的技巧,而对团队谈判的优势以及如何构建高效
中国高职教育用了30年的时间走过了探索、确立、快速发展三个阶段,目前高职教育已经进入快速发展的轨道。伴随着生源的减少和教育市场竞争的加剧,如何通过品牌建设提高自身的
<正>2011年萨尔曼·可汗在《用视频重新创造教育》提出与传统的"老师白天在教室上课,学生晚上回家做作业"方式正好相反的课堂模式,被称为"翻转课堂"或"颠倒课堂"。自此,"翻转
<正>中国古典名著《西游记》讲述的是唐僧师徒历尽千难万险,求取真经的故事,其中的许多情节对企业的经营、管理和发展颇有借鉴意义。本文主要从《西游记》的分析入手,探索团
血管重建(remodeling,重塑或重构)是高血压、动脉粥样硬化等心血管疾病共同的发病基础和基本的病理过程,表现为血管平滑肌细胞增殖、凋亡、迁移和细胞外基质成分变化。研究显