视频图像中文字提取方法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:quzoufeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于内容的图像检索技术是近些年理论研究的一大热点,而文字信息是视频图像中重要的语义线索。由于视频图像中文字具有尺度不一、字体形态多变、方向多变和背景复杂的特点,所以准确快速地将视频图像中的文字提取出来是基于内容的图像检索的关键步骤和技术难点。本文对视频图像的文字提取方法做了较系统的研究,主要工作如下:首先,本文总结出视频图像中文本的一般性特点。并对基于纹理的文本检测方法、基于区域的检测方法、基于边缘的文本检测方法和基于机器学习的文本检测方法进行了深入的探讨,归纳了视频特征提取的主要特征。其次,本文提出了基于笔划的文字提取方法。通过对各类文字笔划均具有对称边缘的特点与多文字区域的几何特征的认识,根据二阶边缘检测算子捕捉边缘点亮暗变化趋势的能力,使用高斯型拉普拉斯算子寻找出与文字笔划宽度相呼应的亮暗呈相反变化的所有的“边缘点对”,并构建来自笔划等窄带区域的“对称边缘点对”样本集。从样本集的分布规律中自适应地定出文字笔划搜索窗的尺度及方向。利用最小生成树算法实现由系列搜索窗得到的所有笔划子区域的关联聚类,通过剪枝、伪区域鉴别和阈值分割,将文字以行(含非水平行)或列的形式提取出来。再次,本文提出了基于文字区域的关键帧提取方法。关键帧是包含一组镜头中关键内容的图像帧,通过基于文字的关键帧提取步骤能够极大的减少图像的冗余。本文针对文字检索系统的特点在文字提取工作的基础上提出了基于文字区域的关键帧提取方法。最后,本文对基于笔划的文字提取和基于文字的关键帧提取进行了详尽地评价与分析。同时,为适应移动互联网的发展趋势,本文将该方法成功地移植到移动平台。实验表明,本文方法对复杂背景下的不同的语言类型、亮暗类型、文字行方向及文字尺度具有适应性和鲁棒性,且平均识别率较高、平均误检率较低、平均运行速度较快。因此,所提方法在应对文字提取问题上具有良好的适应性和鲁棒性。
其他文献
21世纪,互联网正在进入一个快速发展的时期,随着以技术进步和社会变革为动力的网络的迅猛发展,数字媒体技术愈加成熟,网络媒体的进程加快,全球进入到了新媒体时代。以互联网为核
信息安全是当前社会关注的热点问题之一,研究信息安全下的操作系统安全加固中进程和文件保护的关键技术,对于化解操作系统面临的安全威胁,保障系统的安全运行具有十分重要的意义
由于用户需求变更而导致软件项目失败 ,是许多项目失败的重要原因之一 ,只有科学地不断改进和完善对需求变更的管理 ,才能达到驾驭需求变更的目的 .本文首先对软件项目需求管
煤炭是我国主要的一次能源,而且在将来的许多年这一格局仍然不会改变,所以发展低耗能、低排放、低污染的煤发电技术具有深远的意义。为了节约能源和减轻环境污染,国内外许多国家
血管平滑肌细胞(vascular smooth muscle cells,VSMCs)由分化表型向去分化表型的过程,即表型转化,是动脉粥样硬化及经皮冠状动脉介入治疗术后再狭窄等疾病发生过程中新生内膜形成
页岩气成藏条件、岩性、物性、含气性等差异性特征使得不同页岩具体的开发方案和储层改造技术有很大区别,为正确认识页岩气储层的地质特征、储层参数,在实施改造工艺前有必要
<正>《中国达人秀》节目模式完全来源于英国的同名节目现场灯光、舞美效果、流程和选拔模式,来自英国的同行还亲临现场进行指导。这种全面的模式复制,是媒体市场化、全球化的
景德镇窑在宋代以青白瓷闻名,但是关于景德镇窑的起源一直众说纷纭。本文以繁昌窑在五代南唐时期生产最早期的青白瓷为论据,阐述了繁昌窑与景德镇窑青白瓷起源的关系。
本文在依托现有风险管理论和方法的基础上,对山海关污水处理厂工程项目风险管理问题进行研究,并从风险识别、评估和控制三个方面进行全面细致的阐述和分析,并有针对性的提出了山
聚类分析是模式识别与人工智能中发现知识的重要途径之一,传统的聚类分析是一种硬划分。大数据时代出现了高维海量数据,它们往往具有不完备性、不精确性、不一致性等特征,传统聚