【摘 要】
:
视频中的文本信息是辅助理解视频内容的重要线索,有效地提取这些文本信息对视频内容的自动理解及检索等应用来说是一项关键的技术。目前商业OCR还不能有效地识别背景复杂、干
论文部分内容阅读
视频中的文本信息是辅助理解视频内容的重要线索,有效地提取这些文本信息对视频内容的自动理解及检索等应用来说是一项关键的技术。目前商业OCR还不能有效地识别背景复杂、干扰强烈的视频文本图像,寻找一种通用的文本定位与分割方法以提高识别的效率,是当前研究的热点问题之一。本文重点研究视频文本定位与分割的方法。根据复杂背景下视频文本的特点,采用角点提取结合形态学的文本定位方法,针对文字大小不一的问题,提出了多尺度的角点检测方法,并结合文字通常具有相同颜色的特点,采用颜色聚类的方式对文字区域进行更精确的定位;利用小波域隐HMT模型的广泛应用的特点,在小波域内对定位出的文本区域中的文字和背景进行建模,结合尺度间融合思想,充分利用不同尺度上的类标志特性,较好解决了文本区域文字的分割问题,得到文字图像。实验结果表明:本文改进的文本定位算法有效检测出复杂视频中的文本信息,不仅能够检测出球赛场景、新闻类视频中的文字信息,还可用于自然场景文本的检测定位;小波域HMT模型对文本的分割结果优于大津法,在最大限度保留文字部分信息情况下,它突出了文字的特征,提升了文字笔画分割的质量。
其他文献
近年来,OFDM(正交频分复用)技术以相较于传统单载波技术在抵抗多径衰落和增加频谱利用率等方面的巨大优势引起了广泛关注,MIMO(多输入多输出)技术通过在发送端和接收端采用多
无线传感器网络是无线传感器网络无锚点定位技术的基础。本文首先分析了无线传感器网络的特点和无锚点定位的特征。无线传感器网络特点明显,作为一种多跳、自组织、动态的网络
由于地震勘探目标由构造性油气藏逐渐转为岩性油气藏,传统的叠后地震反演技术已经很难满足勘探需要和不断增大的油气需求量。叠前地震数据包含了丰富的参数信息,利用AVO(Ampl
旧电影视频资料是人类宝贵的物质遗产,然而诸多原因使得大部分现存旧视频资料都存在着不同程度的破损,目前亟须修复的旧电影视频数量非常多,且完成一部破损旧视频的修复工作
长的传输时延、多普勒扩散、频率选择性衰落以及有限的可用带宽等诸多因素,决定了水声通信信道的复杂性。水声信道的这些特性阻碍了水下高可靠性、高速率通信系统的发展。
Turbo码采用了迭代译码结构,即使当信噪比较低时,其纠错性能也非常逼近Shannon限。经过近20年的发展,关于Turbo码的研究已取得了长足的进步和发展。如今,Turbo码已广泛应用于
随着海洋开发和利用的不断深入,水声通信技术在海洋经济发展和国防建设中发挥了越来越重要的作用。由于水声信道是一个极其复杂的信道,其多径效应使信号产生衰落,严重影响了
随着经济的发展,海上船舶数量逐年增多,世界重要水道也愈发拥挤。繁忙水域如果船舶间能够雷达信息共享将会提高目标跟踪性能和船舶间避让的协调性。目标跟踪分为航迹起始、航
随着现代科技的进步,各行业涌现出大量以电话授时为基础的多种应用。通过公共电话交换网(PSTN,Public Switched Telephone Network)进行电话授时服务已广泛应用于通信、电力、交
自动导向车是现代物流系统的关键设备,在自动导向车领域,定位导向和避障路径优化是其中的两种关键技术。定位导向技术分为电磁导向、超声导向、激光导向,惯性导向等;路径寻优算法