论文部分内容阅读
随着计算机技术、多媒体技术的飞速发展,以图像为主的多媒体信息被广泛应用于各个领域。图像中的文字信息在一定程度上反映了该图像的部分内容,形成对图像内容的简练描述或说明。提取和识别这些图像文字对于图像的理解、检索和浏览等都具有重要意义。其中准确提取图像中的文字区域是正确识别图像中文字信息的关键。
图像中的文字区域提取作为当前计算机领域的研究热点,目前已有许多算法:如基于边缘、基于连通域、基于纹理、基于学习、基于角点等。由于文字图像背景复杂,文字分布零散,文字大小不一、颜色多样,这些算法仍存在精确度不高、效率不高等问题。
针对目前算法存在的不足,本文先提出一种基于图像灰度特征的文字区域提取算法。先将彩色图像转化为灰度图像,通过分析灰度特征,采用等高行分割与形态学运算相结合的方法确定文字区域。实验证明该方法准确率较高,对于背景复杂,文字尺寸多变的图像同样具有较好的效果。
接着提出一种基于图像彩色特征的文字区域提取方法。抓往图像的RGB颜色特征,通过对图像进行两次动态行列分割提取出文字区域。实验表明,该方法不仅对背景复杂、文字尺寸多变的图像具有较好效果,对文字灰度与背景灰度相差不大的图像同样具有较高的提取准确率。
最后,本文尝试将文字区域提取方法应用于广告垃圾图像过滤。先提取出图像中的文字区域,然后根据文字区域数量和面积等几何特征判定垃圾图像,进行过滤。为了提高过滤效率,专门针对广告垃圾图像特征提出一种基于边缘的文字区域提取算法,实验证明可行。