论文部分内容阅读
网络黄毒的泛滥不仅严重影响青少年身心健康,而且也给人们正常使用互联网带来了诸多不便。如何防止网络黄毒的侵害是个重要的研究课题。目前,通常的网络过滤系统都采用URL封锁和文本信息过滤。但这样是不够的,还应该对嵌在网页中的图像进行分析过滤。本文主要研究了基于人体特征的敏感图像过滤技术。
本文的主要工作是基于皮肤掩码图像提取特征并构建分类器进行图像分类。为了有效去除掩码图像中的噪声,我们提出了基于投票机制的滤波方法。经验证,该方法不但能有效地去除肤色区域内部的小孔,而且能有效去除皮肤区域外部的噪声。经过分析我们发现,在敏感图像中裸露的皮肤占有很大比例、大部分皮肤区域位于图像中心区域、裸露皮肤的最大连通成分面积较大、最大连通成分一般位于图像的中心位置。为此,根据皮肤掩码图像,我们提取了肤色面积百分比、中心区域肤色百分比、肤色最大连通区面积百分比、最大连通区偏心率这几个特征;为了减少大面积肤色背景类图像的误判率,我们提取了最大连通区边框百分比、最大连通区的x.Y纵横比这两个特征;除此之外,我们还提取了图像大小这一特征来检测大头照类图片。基于上述提出的七个特征,我们构建二叉决策树作为我们的图像分类器。为了减少系统的误判率,在决策树的每个层次上我们设定了较为宽松的阈值,以期每一层次上检测出的正常图像尽可能正确。最终通过了决策树检测的图像为敏感图像。
实验结果表明,本文提出的方法对敏感图像和正常图像达到了很好的分类效果。最终的分类效果为查全率85.6%,误判率19.7%。