视频文本提取技术研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户：wangwuhua123456789

【摘要】

：

视频中的文本信息对于视频内容的检索具有非常重要的价值。由于受到背景复杂度、字符与背景的对比度、字符分辨率、字符排列方向和字体大小等因素的影响,对视频文本提取的处

【作者】

：

张建良

【机构】

：

浙江工业大学

【出处】

：

浙江工业大学

【发表日期】

：

2009年期

【关键词】

：

1-SVM 多分辨率亚像素文本定位文本跟踪文本分割

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

视频中的文本信息对于视频内容的检索具有非常重要的价值。由于受到背景复杂度、字符与背景的对比度、字符分辨率、字符排列方向和字体大小等因素的影响,对视频文本提取的处理难度比较大。虽然国内外众多学者在这一方面进行了研究,但效果并不是很令人满意。本文主要围绕国内外涉及比较少的视频文本提取的关键技术——视频文本的定位、跟踪和分割等三个方面进行了深入研究,并系统的提出了视频中文本提取的相关算法。本文主要做了以下工作:(1)为了准确定位文本区域,滤除虚假区域,提出了基于小波模极大值的算法对视频图像帧进行预处理,并引入两阶段分类验证来定位视频中的文本区域。两阶段分类验证包括一个级联分类器和一个一类支持向量机(1-SVM,one class support vector machine)分类器。级联分类器首先对文本和非文本区域进行粗分类,而1-SVM分类器则关注级联分类器输出的文本区域,根据统计特征进行更细致的验证判决,从而大大提高了定位的准确性,降低了漏检率。(2)为避免对每一帧图像都进行文本定位,同时为了提高文本定位的准确率,提出了一种基于稳健模板匹配准则的文本跟踪技术。为了减少匹配误差的计算量,进一步提高文本跟踪的处理速度,引入了多分辨率匹配算法加速文本匹配过程。(3)针对当今视频中文本区域分辨率比较低且受光照影响比较大的问题,为了在提高文本图像的精度的同时减少光照对文本图像的影响,提出了一种基于亚像素的文本分割算法。进而配合使用改进的Niblack阈值分割算法和连通区域分析技术,去除非文本噪声的影响,从而有效地将清晰的文本从背景中分割出来。

其他文献

形式验证技术中流管道近似方法的研究与应用

混合系统是连续动态过程和离散事件动态过程并存,且相互影响、相互作用的一类动态系统。八十年代后期,随着微型计算机、大型通讯网和微处理器在控制领域的大量应用,混合系统

学位

形式验证流管道计算树逻辑商迁移系统初始划分

结构化环境下基于激光和单目视觉的SLAM

未知环境下移动机器人的同时定位与建图(Simultaneous Localization andMapping，SLAM)是自主探索领域的核心问题，自提出以来便受到了广泛关注，相关研究者提出了多种解决方法。目

学位

同时定位建图扩展卡尔曼滤波器结构化环境移动机器人单目视觉激光角点特征

制约县域民间投资发展的因素及对策分析

政府投资对促进县域经济发展、稳定社会信心具有不可替代的作用。但仅靠政府投资远远不能满足县域经济发展的需要,必须加大民间投资力度,以弥补政府投资的不足。本文从投资理

期刊

县域经济发展投资引导市场运行状况民间资本制约因素对策分析工商资本创新能力比习近平资质认定

基于DSO的异步电机无速度传感器矢量控制系统研究

本文在电机矢量控制模型基础上，考虑转子时间常数的影响，在线辨识定子电阻实际值，实现驱动系统宽范围调速，其主要工作如下:　　1、分析比较了感应电机矢量控制系统的几种主流控制

学位

无速度传感器异步电机矢量控制系统

面向移动GIS的空间数据引擎设计与实现

随着GIS技术的发展与社会需求的不断变化，人们已经不能满足于传统GIS所提供的各种信息处理与服务，迫切希望能够在野外移动环境中获得GIS的支持与服务。嵌入式技术的发展使得GIS

学位

嵌入式GIS空间数据引擎空间索引算法面向对象地理空间集成

基于改进的二阶互信息医学图像配准技术研究

医学图像配准具有很重要的临床应用价值，对各种使用不同成像手段所获取的医学图像进行配准，不仅可以用于医疗诊断，还可以用于手术计划的制定、病理变化的跟踪、治疗效果的评价等

学位

医学图像图像配准医疗诊断二阶互信息

视频文本提取技术研究

其他学术论文