自然场景中多语言文字区域检测技术

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:nm76181156
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机视觉的任务中,自然场景的文字区域检测是一项具有挑战性的任务,在自然场景下检测文本区域有助于计算机对场景的理解和描述,计算机对于所处环境具有认知能力是无人车、家庭机器人等自动化设备的智能化的基础。随着互联网多媒体数据的积累和GPU等硬件计算能力的提升,深度学习开始应用在各项计算机视觉的任务中,在某些领域深度模型的性能远远超过一些传统算法。在多媒体视频的字幕区域检测任务中,基于颜色、空间尺度以及文字区域比例等传统方法已经取得较好的效果,但传统算法对于自然场景下的多语言文字区域的检测效果并不理想,本文提出了一种高效可行的方法,通过验证单语言文字区域检测模型的泛化能力,将已训练的单语言检测模型迁移到多语言检测任务中。深度学习的方法需要数据量巨大的标注训练集,在数据增广方面,数据生成系统能够生成具有多尺度字形和丰富字体的自然场景数据,解决了标注数据匮乏的问题;在算法方面,将语义分割模型迁移到文字区域检测的任务中,利用带标签的单语言字符数据训练VGG模型得到单语言的字符分类器,并将该网络的卷积层部分迁移到全卷积网络中作为特征提取器,同时作为全卷积网络的初始化参数;在模型泛化方面,将单语言检测模型通过迁移学习应用到多语言文字区域检测的任务中,将已训练的单语言检测模型经过多语言标签数据集微调后,通过设置对比实验评估单语言检测模型和多语言检测模型的模型偏差,验证了单语言检测模型具有自然场景下检测多语言文字区域的能力。
其他文献
研究背景:大肠癌是常见的消化道恶性肿瘤,具有高复发和高转移的特点。其5年总体生存率在60%左右,近年来发病率逐步上升,严重危害人民生活健康。目前对于大肠癌的发病及其转移
<正>干燥综合征是一种慢性炎症性自身免疫性疾病,特征为累及唾液腺、泪腺等外分泌腺受损,功能下降,临床表现为口干、眼干,并可出现腺体外其他器官受累,导致多系统损害,其发病
传统工程项目管理多从承包商单一角度研究工程项目质量、费用和工期的控制或优化,这种研究方法忽略了其他项目相关方的利益,从而导致不少建设项目超预算、超工期、质量事故时
目的:在脓毒症早期心功能就开始发生改变,随着心功能损害程度的加重,病死率也随之增高。因此早期发现脓毒症患者心功能损害,避免其进一步发展,对脓毒症的救治有着重要的临床意
α-淀粉酶抑制剂(α-amylase inhibitor)是一类能抑制消化道中糖类吸收的物质的统称,它是通过抑制和降低肠道内唾液淀粉酶及胰淀粉酶的活性,阻碍食物中碳水化合物的水解和消
基于随机森林多遥感因子的降尺度方法MIRF作为一种新近提出的地表温度空间降尺度方法,避免了因为降尺度因子单一化和回归模型线性化给降尺度带来的不确定性。该方法只是在特
目的探讨超声诊断胃癌的临床应用价值。方法回顾性分析经超声、钡餐检查,胃镜或手术病理证实的40例胃癌患者临床资料。结果与病理诊断符合率,X线钡餐为95%,超声诊断为98%。胃
东流水道位于江西九江和安徽安庆之间,为顺直多分汊河型。该水道上段被老虎滩分为两汊,左侧称为老虎滩北槽,右汊即为东港。近年来,东港迅速发展,从而导致主航道所在的老虎滩