视频文本提取技术研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:wangwuhua123456789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频中的文本信息对于视频内容的检索具有非常重要的价值。由于受到背景复杂度、字符与背景的对比度、字符分辨率、字符排列方向和字体大小等因素的影响,对视频文本提取的处理难度比较大。虽然国内外众多学者在这一方面进行了研究,但效果并不是很令人满意。本文主要围绕国内外涉及比较少的视频文本提取的关键技术——视频文本的定位、跟踪和分割等三个方面进行了深入研究,并系统的提出了视频中文本提取的相关算法。本文主要做了以下工作:(1)为了准确定位文本区域,滤除虚假区域,提出了基于小波模极大值的算法对视频图像帧进行预处理,并引入两阶段分类验证来定位视频中的文本区域。两阶段分类验证包括一个级联分类器和一个一类支持向量机(1-SVM,one class support vector machine)分类器。级联分类器首先对文本和非文本区域进行粗分类,而1-SVM分类器则关注级联分类器输出的文本区域,根据统计特征进行更细致的验证判决,从而大大提高了定位的准确性,降低了漏检率。(2)为避免对每一帧图像都进行文本定位,同时为了提高文本定位的准确率,提出了一种基于稳健模板匹配准则的文本跟踪技术。为了减少匹配误差的计算量,进一步提高文本跟踪的处理速度,引入了多分辨率匹配算法加速文本匹配过程。(3)针对当今视频中文本区域分辨率比较低且受光照影响比较大的问题,为了在提高文本图像的精度的同时减少光照对文本图像的影响,提出了一种基于亚像素的文本分割算法。进而配合使用改进的Niblack阈值分割算法和连通区域分析技术,去除非文本噪声的影响,从而有效地将清晰的文本从背景中分割出来。
其他文献
混合系统是连续动态过程和离散事件动态过程并存,且相互影响、相互作用的一类动态系统。八十年代后期,随着微型计算机、大型通讯网和微处理器在控制领域的大量应用,混合系统
未知环境下移动机器人的同时定位与建图(Simultaneous Localization andMapping,SLAM)是自主探索领域的核心问题,自提出以来便受到了广泛关注,相关研究者提出了多种解决方法。目
政府投资对促进县域经济发展、稳定社会信心具有不可替代的作用。但仅靠政府投资远远不能满足县域经济发展的需要,必须加大民间投资力度,以弥补政府投资的不足。本文从投资理
本文在电机矢量控制模型基础上,考虑转子时间常数的影响,在线辨识定子电阻实际值,实现驱动系统宽范围调速,其主要工作如下:  1、分析比较了感应电机矢量控制系统的几种主流控制
随着GIS技术的发展与社会需求的不断变化,人们已经不能满足于传统GIS所提供的各种信息处理与服务,迫切希望能够在野外移动环境中获得GIS的支持与服务。嵌入式技术的发展使得GIS
医学图像配准具有很重要的临床应用价值,对各种使用不同成像手段所获取的医学图像进行配准,不仅可以用于医疗诊断,还可以用于手术计划的制定、病理变化的跟踪、治疗效果的评价等