论文部分内容阅读
随着互联网、网络流媒体技术和多媒体信息检索的发展,图像和视频已成为当前多媒体信息交流和服务的主流信息载体。第四代(4G)数字通信网络的出现,微信等即时通信模式使信息传播具备更加快速、广泛的特点。互联网丰富的内容给网民带来便利的同时,内容安全也成为更加棘手的问题。政治反动、淫秽色情、商业机密以及个人隐私等敏感信息的传播对国家安全、社会稳定以及青少年的健康成长均有较大程度的影响。目前纯文本的敏感信息过滤已经相对成熟,但对图像内嵌文字的提取、敏感图像及视频的快速识别等问题仍然存在相当的挑战性。本文瞄准网络监控的内容安全重大需求,以图像内嵌文字为线索进行多媒体内容分析,重点研究场景图像中的文本检测和提取技术;针对本领域的敏感数据传输、存储安全要求,研究私有协议的文字及图像编解码算法,提升数据压缩效率同时兼顾数据信息安全;最终结合文字及图像信息,实现移动互联网多媒体的敏感内容监控。本文的主要研究成果可概括如下:1、针对复杂背景下的文字区域的检测问题,提出了一种基于Gabor纹理和神经网络的由粗到细的文字区域检测新方法,对多语种的文字区域取得较好的效果。针对图像背景复杂造成文字区域难以检测的问题,利用文字区域纹理的方向性,提出一种基于Gabor纹理和神经网络的由粗到细的文字区域检测新方法。首先,通过不同方向和尺度下的Gabor特征来描述原始图像中文字区域的方向性纹理;然后,将文字区域和非文字区域的Gabor特征输入到BP(Back Propagation,反向传播)神经网络训练文字区域分类器,训练好的分类器用于图像和视频中文字区域的检测。实验结果表明,本文算法显著提高了文字区域检测算法的准确性和鲁棒性,对中、英文等多语种的文字区域检测均有较好效果。2、针对图像内嵌文字的提取问题,提出一种基于小波纹理同质空间映射的图像文本提取方法,取得了86%的提取精度。针对图像内嵌文字的提取方法,研究了一种基于小波纹理同质空间映射的图像内嵌文字快速提取算法,内嵌文字的图像作为研究对象,通过图像增强函数来突出图像的边缘和纹理特征;利用小波包提取24维度的纹理特征向量,同时用Sobel算子提取增强图像边缘特征信息;对纹理特征和边缘特征来构造图像的同质性并映射得到特征图像,利用非文本和文本区域同质性之间的差异来进行区分,从而抑制非文本区域信息,突出文本区域特征;再利用同质性空间对文本样本图像进行训练得到文本区域检测器来检测文本区域,大大减少了计算量;最后通过字符分割和字符识别单元完成文本的提取。为了验证算法的有效性和实用性,实验结果文字识别率86%略高于业界水平,该算法为运营商的不良信息监控提供保障。3、针对网上敏感文本信息的压缩、传输与安全问题,提出一种基于Glomb参数局部优化的文本数据压缩算法,获得了优于Winzip的压缩性能。针对政治类等敏感文本数据,数据在存储、传输、应用过程中的安全保障是一个棘手的问题,私有协议的数据编解码算法在兼顾数据压缩效率的同时提供了必要的安全保障。提出了一种基于Glomb参数局部优化的文本数据压缩算法,将扫描产生的偏移量,匹配数据长度等全局优化问题转化为局部优化问题,并从Glomb编码思路出发,推导出一种参数选择算法;对LZ77算法进行修正,提出一种预测编码方法,获得预测参数。对预测参数、偏移量、数据匹配长度、保留文本数据使用MQ(Message Queue)算术编码器进行编码,针对不同类型数据,设计出不同的编码算法和相应的上下文算法。实验结果表明对纯文本数据、Word文档数据、C语言程序代码,图像数据等,本压缩算法都优于Winzip;在纯文本数据、Word文档数据、C语言程序代码压缩方面与WinRar相当或者略好,但在图像压缩方面的性能与WinRar相比略有不足。4、针对网上敏感图像数据的压缩传输及安全问题,提出一种基于JPEG-LS算法的误差优化编码的图像压缩算法,取得了良好的压缩效果。为了保障互联网敏感图像数据在传输和存储过程的安全,需要研究私有压缩算法来保障数据安全,实现对高精度图像进行高效压缩,同时确保重建图像有较好的视觉质量。提出了一种基于JPEG-LS算法的误差优化编码的图像压缩算法,使用JPEG-LS压缩算法对高精度图像数据进行压缩,对游程编码产生误差数据进行量化,对量化值进行数据分解,去除量化值之间的相关性,分解后的数据进行算术编码。根据量化间隔重建反量化值,对重建量化值进行反量化,与JPEG-LS解码数据相加,然后进行滤波。理论分析和实验结果验证,效果良好。5、针对4G通信中的敏感文字信息及不良视频过滤问题,研究开发了基于文字与肤色关键语义的敏感影像检测应用系统研究,并应用于广东移动现网系统。为了满足移动互联网的实际应用要求,研究基于敏感文字和不良图像视频的快速识别应用系统十分必要,主要研究4G通信中的敏感文字信息及不良视频过滤技术,主要包括政治类敏感文字和淫秽图像。视频的关键帧是视频的梗概,对关键帧进行敏感性判别将减少计算量。针对淫秽图像的识别,肤色非常重要的人体特性,人类肤色在彩色空间具有一定的聚类性,因此利用肤检测复杂背景中的人体更符合实际应用需求。结合人脸、人体器官特征等方法来判别多媒体的敏感性,并跟踪敏感的关键帧以判断整个视频的敏感性,将为移动运营商的互联网管道上的内容安全提供安全保障。