图像中文字区域提取算法研究与应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:hanxichen6
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术、多媒体技术的飞速发展,以图像为主的多媒体信息被广泛应用于各个领域。图像中的文字信息在一定程度上反映了该图像的部分内容,形成对图像内容的简练描述或说明。提取和识别这些图像文字对于图像的理解、检索和浏览等都具有重要意义。其中准确提取图像中的文字区域是正确识别图像中文字信息的关键。 图像中的文字区域提取作为当前计算机领域的研究热点,目前已有许多算法:如基于边缘、基于连通域、基于纹理、基于学习、基于角点等。由于文字图像背景复杂,文字分布零散,文字大小不一、颜色多样,这些算法仍存在精确度不高、效率不高等问题。 针对目前算法存在的不足,本文先提出一种基于图像灰度特征的文字区域提取算法。先将彩色图像转化为灰度图像,通过分析灰度特征,采用等高行分割与形态学运算相结合的方法确定文字区域。实验证明该方法准确率较高,对于背景复杂,文字尺寸多变的图像同样具有较好的效果。 接着提出一种基于图像彩色特征的文字区域提取方法。抓往图像的RGB颜色特征,通过对图像进行两次动态行列分割提取出文字区域。实验表明,该方法不仅对背景复杂、文字尺寸多变的图像具有较好效果,对文字灰度与背景灰度相差不大的图像同样具有较高的提取准确率。 最后,本文尝试将文字区域提取方法应用于广告垃圾图像过滤。先提取出图像中的文字区域,然后根据文字区域数量和面积等几何特征判定垃圾图像,进行过滤。为了提高过滤效率,专门针对广告垃圾图像特征提出一种基于边缘的文字区域提取算法,实验证明可行。
其他文献
计算机技术迅速发展。从硬件技术看,CPU速度越来越高,处理能力越来越强;从软件技术看,应用程序的规模不断扩大,特别是Internet及www的出现,使计算机的应用范围更为广阔,许多应
在计算机领域,智能体(Agent)是一种在分布式系统或协作系统中能持续自主发挥作用的计算实体。Agent具有的良好互操作性为其在异构系统进行快速交换信息、协同工作提供了坚实
21世纪前几年,伴随着互联网的飞速发展,对等计算(Peer-to-Peer,简称P2P)和对等网络作为一种的分布式计算架构,进入我们的视野和生活。与传统的客户端朋艮务器(C/S)架构不同,P
企业中的供应链管理系统,尤其是大型企业的系统历经多年的建设,已经颇具规模,但是也存在一些突出的共性问题,如集成效果不理想、适应业务变化的能力差和系统总拥有成本高等。
资源共享是计算机和互联网技术快速发展的形势下形成的一种重要应用。实际应用中,共享资源的主要是各类文件。资源共享应用管理系统一般包括共享资源的存储、管理以及访问方
随着通信技术的高速发展,消费类电器和嵌入式设备的技术开发的瓶颈问题日益突出。首先,这些设备普遍使用C语言和专用的实时操作系统,开发速度慢,也没有动态加载应用程序的能
随着移动设备数量和移动互联网流量的增长,集中式移动锚点(Mobility Anchor, MA)成为制约网络移动管控整体性能的瓶颈。分布式移动性管理(Distributed Mobility Management,