基于内容的敏感网页过滤器的研究与实现

被引量 : 0次 | 上传用户:tyb798229
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的快速发展使人们能够轻松地实现海量信息资源的传输与共享,给人们的生产、生活和信息交流带来了极大的便利,对全球经济、文化的交流起到了巨大的推动作用。然而,这也给不法分子发布和传播色情、暴力、反动等敏感信息提供了机会。Internet上的信息量以指数形式飞速增长,信息类型也变得更加丰富,由单一的文本方式逐步变为以图像、视频等多媒体信息为主的表现形式。色情、暴力等敏感视频因其具有强大的视觉冲击力而成为了不法分子广为传播的对象,借助互联网这种跨地域、跨国界、开放式的通讯方式,它的不良影响将遍布世界各个角落,给社会稳定、人们的日常生活带来了严重的毒害作用。因此,敏感网页过滤器的设计与开发对营造我国绿色互联网环境、维护安定的社会环境、保护网民特别是青少年身心健康具有非常重要的意义。基于此,本文利用BHO技术设计并实现了敏感网页过滤器,该过滤器由网址过滤器、网页文本过滤器和网页敏感图像过滤器三个子过滤器组成。首先对网址进行过滤,BHO技术可以实现从IE浏览器的地址栏中获取访问网页的URL。将该URL与敏感URL数据库中的信息进行比较,如果该URL是敏感网址,则返回空白网页,否则进行网页文本和网页图像的检测。其次过滤网页文本,如果获取的URL是非敏感网址,则浏览器下载网页资源并进行网页文本和图像过滤,通过DocunmentComplete事件可以获知网页内容是否下载完毕,下载完毕后,通过DHTML文档模型来获取文本内容,并采用最大跳跃(SMA)算法将网页文本与敏感词汇数据库进行匹配。最后进行网页敏感图像过滤,采用人脸检测、肤色检测、皮肤纹理检测和分类器识别结合的敏感图像检测算法进行检测。人脸检测的目的是确定图像中包含人物,利用Sobel算子和统计直方图模型进行基于纹理的肤色检测,以确定图像中的肤色区域,利用Gabor滤波法对图像中的肤色区域进行皮肤纹理检测,采用分类器对敏感图像和非敏感图像进行识别。实验测试结果表明,本文设计的敏感网页过滤器能够有效拦截并过滤敏感网页,基本上实现了对敏感站点访问的控制。
其他文献
《论衡》成书于东汉初年,作者王充,不仅是中国哲学史上的一部奇书,在汉语发展史上也占有重要的地位。其中一些内容与当时口语较为接近,能够较真实地反映当时的语言面貌,是我
语文之美在于文字所渲染出的朗读美、欣赏美、想象美。一直以来,语文始终追求着一种诗意的教学效果,希望在这诗意的语文教学中让学生领略自然,感悟人生,剖解生命。朱光潜的美
语用预设对于翻译的意义这一概念最早由Peter Fawcett在他的Presupposition and Translation一文中进行了阐述。他讨论了语用预设的定义、构成、分类、特征等基本概念,探讨了
新课程倡导的识字教学理念是“多认少写、及早阅读、读写分开。”识字教学是小学低年级语文教学的重点、是学生口头语言表达过渡到书面语言的桥梁。所以,识字教学的质量关系
期刊
在世界上,我国是水资源匮乏的国家之一,而严重浪费水资源却屡见不鲜。分析水资源浪费的主要原因,并提出了相应的对策。
外语学习的“费时低效”饱受国人诟病,相比之下,母语习得却轻而易举,无往不胜。聚焦如何借鉴母语习得理论提升外语教学效率,介绍了五种母语习得理论,分析了母语习得理论对外
随着国际交流的日益频繁,会议口译作为有效的跨文化交际媒介,早已进入国内外专家学者的研究视野。开场白和结束语的口译虽是会议口译的核心部分,在营建与会各方良好的交流与合作
<正> 城市景观设计包括的内容很广:城市的空间处理;城市的整体轮廓线;城市中一些标志点的设计;城市广场、道路、公共绿地的规划设计;城市与江、河、湖、海、山川、森林、田野
紫外光固化技术用于压敏胶的制备生产,具有以下优势:固化速度快,固化温度低,可避免热敏感基质塑料薄膜、纸张、电子产品等损伤,固化需用辐射能低,固化设备投资小且结构紧凑,无
<正>"看到的不易记,听到的容易忘,动手做才能学得会。"小学数学教学中,不仅要让学生听,让学生看,更要让学生亲自动手操作,在动手操作中学习数学知识和理解数学概念,发展学生