新闻视频图像文字定位与切分方法研究

来源 :河南理工大学 | 被引量 : 1次 | 上传用户:shenloa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年,伴随着计算机技术与多媒体信息技术的快速发展,视频和图像资源日益丰富起来,正逐渐成为人们进行信息交互的主流媒体,如何从这些海量的视频、图像中获取人们感兴趣的信息也正逐渐成为多媒体技术研究者们关注的热点。相对于颜色、亮度等低层信息,视频、图像中的文字信息属于高层语义信息,是理解视频和图像内容的重要线索,同时获取视频、图像中的这些文字信息对于建立基于内容的视频与图像检索系统也具有极其重要的价值。新闻视频中的字幕信息属于高层语义信息,通常是对某一新闻事件的概括总结,为理解新闻视频内容提供了重要的线索。因此,获取新闻视频中的字幕信息,有助于对新闻视频内容的自动标注,同时也有利于快速建立基于内容的新闻视频索引系统。本文主要面向新闻视频图像,针对文字提取的相关关键技术展开研究,主要包括新闻视频图像中标题字幕区域检测定位算法研究及文字行切分算法研究,并获得了一些研究成果,具体工作如下:(1)新闻视频图像中,字幕背景通常复杂多变,造成直接获取字幕信息具有一定的难度,检测定位字幕区域是获取字幕信息的重要前提。本文主要面向新闻视频图像中标题字幕,基于图像中文字丰富的边缘特性,并结合新闻视频图像中字幕的属性特征(位置、尺寸等),提出了一种基于最大特征得分区域(Maximum Feature Score Region,MFSR)的标题字幕检测定位算法。相比于传统的基于投影直方图的检测定位算法,本文算法的检测定位精度更高,同时该算法可以应用于电影、电视剧等视频图像对话字幕的检测定位,且对不同国家的语言文字不敏感。(2)文字识别准确率对于准确地获取文字信息具有极其重要的影响,为了降低视频图像文字的识别难度,提高文字识别准确率,针对文字切分算法进行了研究。本文主要以新闻视频图像中的标题字幕行(以中文汉字为主)为切分对象,结合字幕行的结构特点,提出了一种基于模板匹配的文字切分算法。该算法以文字整体分布为对象,根据模板函数的响应值确定合适的切分路径,有效地克服了传统算法易分裂汉字的问题。
其他文献
本研究与传统冰箱冷冻相比较,研究了热烫处理苹果片的真空冻结特性。真空冻结40 min后,经热烫处理的苹果片冻结最低温度达-27.6℃,质量损失为27.5%,而未经热烫处理的苹果片的
目的探讨胰腺癌的螺旋CT征象及术前评估价值。方法回顾性分析经手术、穿刺活检或随访证实的26例胰腺癌患者的CT表现特点。结果CT表现平扫略低密度23例,等密度3例,胰腺期表现为
目的分析放射科肋骨骨折漏诊原因,建立防范对策。方法在首次摄片后3d~2个月复查,对胸部进行多体位投照,并对X线表现逐一进行回顾性分析。结果32例患者检出肋骨骨折新增43处,
通过对w(Al2O3)≥80%的矾土熟料和矾土均化料的性能检测发现:均化料的致密度(体积密度3.42g·cm-3,显气孔率0.84%)优于矾土熟料的(体积密度3.32 g·cm-3,显气孔率4.19%);应用
患者,男,78岁。右侧肩胛、胸背部持续性隐痛不适1个月,于2006年8月7日入院。疼痛以夜间休息或清静时明显,不放射,药物及物理等方法治疗效果不明显,胸部疼痛日趋加重。查体:锁骨上下
微波加热是食品加工的一种新型技术,为探讨微波加热对牦肉糜凝胶特性的影响,采用单因素试验设计,研究微波加热的时间、功率以及NaCl添加量对牦牛肉糜凝胶质构特性和保水率的