基于图像的文字提取算法的研究与设计

来源 :东南大学 | 被引量 : 0次 | 上传用户:java_xz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术,信息技术日新月异的发展,越来越多的信息通过图像进行传输。图像中的文字作为传达语义的重要载体,包含了非常丰富的内容。在这些技术高速渗透国人政治与经济生活的时代,它们不但给人们带来了极大的方便,同时也对信息安全,信息管理带来了极大的挑战。因此面对海量的图像,如何高效率的对图像内容进行提取成为人们必须解决的问题。   文字提取技术能够实现把图像中的文字提取出来,从而可以自动对图像中的内容进行标记,为信息监管带来极大的方便。然而文字风格各异,大小不同,如何设计一种文字提取算法确保对大部分文字都能准确的识别就显得尤为重要。典型的文字提取算法有边缘检测法,数学形态学处理法,角点检测法,纹理检测法等等。其中边缘法和数学形态学法对文字字体,大小不敏感,对大部分文字提取都有效。   本文从基于边缘检测和形态学相结合的算法思路入手,针对文字提取的思想进行了深入的研究,并提出了有效的改进算法,切实解决了一些原有算法无法解决的问题,得到了一些研究成果,主要工作如下:   1基于边缘检测,形态学和颜色定位方法对简单字符的提取算法进行了研究。以车牌号码为例对简单字符提取思想进行了验证,利用增加的颜色定位算法进行了改进,文字提取效果的准确度和完整度得到提升。   2对复杂背景下的文字进行了提取研究,提出了具有自适应阈值选取功能的边缘提取算法,增强了算法的鲁棒性,还提出了基于等价像素点形成的最大外接矩形连通域算法,克服了基于区域膨胀生长的连通域算法的不精确性和对不同大小尺度文字的敏感性。   3对动态图像的文字切换帧捕获采用了基于改进的多帧结合的方法,在原有多帧结合捕获文字切换帧的基础上,加入了验证帧算法对初步捕获的帧进行验证,最终提取出可信度很高的文字切换帧,提高了帧捕获准确度。   4对动态图像的字幕提取采用了连通域膨胀连接的思想,克服视频文字分辨率较低而不容易准确提取的困难。
其他文献
阈值分割方法作为传统图像分割方法的重要分支,其实时性能的好坏直接影响着整个系统的运转效率,成为衡量阈值分割方法优越性的一项重要指标。传统的阈值分割方法,随着阈值数
小波分析的兴起得益于其良好的时-频局部化能力,对于含有点奇异的目标函数,小波提供了最优的非线性逼近阶。但由于其有限的方向性,由一维小波张量而成的二维可分离小波并不能最
水声目标识别是水声信号处理和海洋工程的研究重点。目前基于各种理论来提取水声目标特征的方法繁多,但是国内外针对特征的评价研究却很少。由于海洋环境多变复杂,特征数据不纯
干涉合成孔径雷达(Interferometric Synthetic Aperture Radar,缩写:InSAR或IFSAR)利用多个接收天线或单个天线重复观测得到的回波数据进行干涉处理,可以精确获取地面的高程
随着无线网络技术和嵌入式技术的发展,人类在物理世界和虚拟世界的活动空间不断扩大。无线传感器网络作为近年来无线通信领域的一个研究热点,其广阔的应用前景被普遍看好。无线
MIMO系统通过在发送端和接收端配置多根天线构成多个独立的空间衰落信道,与传统的单天线系统相比,能够在发送功率和带宽不变的条件下成倍地提高信道容量,从而提高数据传输的
云计算应用的不断发展对云计算数据中心提出了新的挑战。连接数据中心内大规模服务器的数据中心网络也已成为学术界和工业界的研究热点。传统的数据中心网络基于电分组交换和
超宽带(UWB,Ultra Wideband)无线通信技术以传输速率高、抗多径干扰、低功耗和隐蔽性好等优点受到人们的关注,并逐渐成为通信领域理论研究、实验开发和商业应用的热点,成为了下
随着宽带无线通信及移动互联网的发展,HEVC/H.265因具有高分辨率、高帧率和高压缩率等特点,在高清电视、监控及高清网络视频等应用领域将具有广阔的应用前景。然而在恶劣的无线
微波稀布阵雷达利用大型稀布阵发射天线孔径和多载频正交信号,在接收站采用小型均匀阵列或单根天线接收,通过综合发射方向图实现对目标的高精度定位与跟踪。论文主要研究该雷