基于深度学习的旋转文本检测算法

来源 :南京大学 | 被引量 : 0次 | 上传用户:hzau1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本检测是文字提取的前提,也是计算机视觉中的经典问题之一。其任务是用框去标出图像中文本的位置。图像中的文本一般分为两类:人工文本排列规整,检测简单。场景文本在字体,颜色,形态,方向上有更多的复杂性。传统的文本检测算法需要手工设计特征,在场景文本检测任务中不够鲁棒。端到端的检测框架有固定的位置以及长宽比例,对于长宽、姿态变化的字符,在训练及测试阶段均无法获得精确的检测信息。TextBoxes采用结构简单的深度神经网络,构建了一个端到端的文字检测系统。全卷积回归网络(FCRN)采用合成的图片进行文字检测。然而,这些算法虽然对文本检测有一定的推动作用,但是他们只适用于水平倾斜的字符检测。然而自然场景中,文字的方向是多变的,需要一个适应任何方向的检测算法。本文提出一种基于深度学习的旋转文本检测算法,该算法基于U-net网络思想,融合高低层特征,满足不同比例的文本行。算法模型可以分解为三个部分:特征提取网络、功能归并层和输出层。特征提取网络采用5层卷积池化结构,每一个卷积层都后接一个池化层。功能归并层使用连接操作将相同尺寸的特征图进行归并。输出层采用INMS(Inclined Non-Maximum Suppression)的候选框选择策略输出候选框的得分和四个角坐标。其创新点主要在于:●改进了基础特征提取网络,适应多尺寸输入:采用VGG16的FCN网络,只采用卷积和池化操作,能够适应任意大小的输入图像,无需对输入图片进行预处理,使用方便。●改进了多方向文本策略,降低算法复杂度:大量运用3*3,1*1的小卷积核,1*1的卷积核有利于降维,增加非线性,3×3的卷积核有利于增加空间感受野,减少参数。采用仿射变换的图像预增强策略能够使得训练集完备,提升模型性能。针对多方向文本,设定合适的候选框策略。●改进了 NMS候选框策略,适应多方向检测:采用INMS的候选框选择策略,能够适应多种方向的文本检测,对倾斜的文本行检测效果更佳。经过多次数、多样本的测试予以验证,本文提出的一种基于深度学习的旋转文本检测算法。该算法具有泛化性能高、检测速度快、检测精度准、兼容小目标和尺度多变目标的特点,能够减少人力劳动,减少检测成本。在自然场景数据集和工业喷码图集上也有很好的应用效果,满足自然场景文本和工业场景文本的检测要求。
其他文献
随着科技的高速发展,多媒体技术的介入不仅使展示设计的视觉表现方式更加多样化,而且也使展示形式更加多元化。科技馆作为我国实施科教兴国战略的基础设施,是知识经济时代不可或缺的社会教育阵地,需要顺应时代的步伐引入新方法、新形式,从而全面提升自己的教育职能。与此同时,不少博物馆、科技馆将“沉浸式体验”纳入展示设计中,从而引发了“沉浸式体验”的观展热潮。沉浸式是科学技术快速发展下的新产物,是将多媒体技术、空
微生物转化是利用微生物体内丰富的酶与外源底物进行反应,从而创造“非天然”天然产物的一种方法。利用微生物对外源分子进行转化,往往能够得到化学合成难以获得的新颖结构,此技术在新药研究和创新药的开发中显得越来越重要,是研制新型药源分子的重要方向之一。本论文采用一株含有复杂酶系的昆虫肠道共生真菌Daldinia eschscholzii IFB-TL01作为转化菌,对具有一定生物活性的常见小分子化合物进行
在互联网高速发展的今天,应用软件呈井喷式出现,相同类型的软件数量呈指数上升,软件的性能与质量逐渐成为决定用户体验的重要因素,直接影响着软件的生存曲线。软件性能测试是与软件质量密切相关的测试类型。在性能测试执行过程中,需要对系统关键性指标进行收集与监控。现有的性能测试工具提供了强大的性能测试功能,它们能够对不同的负载条件进行高度模拟,全方位地测试系统的关键指标,并能够统计丰富的指标并以图表曲线形式展
随着新型城镇化的提出,提高市民化水平愈发重要。中央政府决定有序推进农业转移人口市民化进程是近期中国城镇化工作的重点,与此同时要贯彻实施乡村振兴战略,建立健全城乡一体化体制机制和政策体系,构建新型工农关系。新疆作为国家重点扶持地区,在《自治区住房城乡建设事业“十三五”规划纲要》中提出,到2020年新疆城镇化率要达到58%,户籍人口城镇化率要达到45%。这意味着新疆的市民化还有很长的路要走。而农民工作
时下我国经济突飞猛进,新业态不断出现,市场行为五花八门,市场主体之间的不正当竞争行为亦日趋复杂化。随着互联网产业整体高歌猛进和大数据时代的到来,互联网新技术、新商业模式愈发繁杂,出现了新的市场主体、新的市场客体、新的市场载体和新的市场交易规则。不仅如此,互联网所具有的全球性、开放性及技术性,不但为市场主体提供了发展机会,亦为某些不正当竞争行为的实施提供了便利。商业诋毁行为是经营者为了损害他人利益或
学位
学位
VMware Nimbus是一个基于VMware vSphere?私有云套件,使用Ruby进行开发,为VMware的产品提供自动化部测试的私有云。VMware Nimbus每天会接受上万个测试任务。在用户提交测试任务的高峰期,Nimbus会因为达到资源瓶颈而导致资源竞争问题,严重影响系统的稳定性。一旦发生资源竞争,此时用户提交的大批量的的测试任务效率将会大幅下降,这将引起测试任务测试时间大幅延长,
严格责任源于英美刑法,是与我国传统的罪过责任截然不同的一种刑事归责原则,在其发展早期由于其固有的严格性而受到诸多学者的反对。然而经过一个多世纪的发展,严格责任的含义已经发生了很大变化,呈现出由绝对严格责任向相对严格责任转变的特点。相对严格责任是指在刑法有明文规定的情况下,对于某些主观罪过不明确或者主观罪过难以证明的特殊犯罪,根据行为人的行为或行为的危害结果推定行为人具有主观罪过,并由行为人举证证明
学位