【摘 要】
:
随着互联网的快速发展,图像逐渐成为信息的主要载体,而图像中的文本信息可以帮助计算机更加准确的理解图像内容。但自然场景下文本的背景复杂多变,文字样式不一,嵌入位置不定,直接将OCR应用到自然场景中很难获得令人满意的效果。因此本文进行了基于深度神经网络的自然场景文字检测和识别方法研究,本文的研究内容主要体现在以下几个方面:1)提出了一种基于深度神经网络的多方向文字检测方法。针对文本具有较大横纵比的特点
论文部分内容阅读
随着互联网的快速发展,图像逐渐成为信息的主要载体,而图像中的文本信息可以帮助计算机更加准确的理解图像内容。但自然场景下文本的背景复杂多变,文字样式不一,嵌入位置不定,直接将OCR应用到自然场景中很难获得令人满意的效果。因此本文进行了基于深度神经网络的自然场景文字检测和识别方法研究,本文的研究内容主要体现在以下几个方面:1)提出了一种基于深度神经网络的多方向文字检测方法。针对文本具有较大横纵比的特点,本文构建了一种提取多尺度特征的卷积神经网络,并提出了一种文本线构造算法,使网络可以有效的检测倾斜文本。2)提出了一种基于注意力机制解码的文字识别方法。首先使用深度卷积神经网络提取图像的特征,然后使用两个循环神经网络实现对特征编码和解码。解码时利用注意力机制获取全局特征,利用CTC实现对注意力的约束,使网络可以快速收敛。3)本文对提出的检测和识别方法在不同数据集上进行了全面的分析和验证。与当前算法相比,本文提出的方法取得了不错的结果。
其他文献
单光子雪崩光电探测器(SPAD)具有雪崩增益大、响应速度快、探测效率高、易于集成的特点。SPAD阵列器件可进行弱光三维成像,在生物化学、量子通信、激光雷达等领域具有重要应
递归程序由于是多次调用自己本身,因此在运行过程中其运行轨迹和参数值的变化较复杂,采用树型结构描述运行轨迹和参数变化有助于正确理解递归程序。
汽车前轴是一种比较大型的杆类锻件,对其进行锻造特处理之后,常会出现扭曲变形等问题,对于产品的加工是极为不利的。所以就要通过人工等方面对这种变形扭曲进行纠正。本文就汽车
陈垣书学思想主要体现于与其子陈约往来信件中。以"平正"为标准,他认为楷、行、草优于篆、隶,然而在对子教学中,于篆书涉及甚多,未体现"五体高下";陈垣强调入门须"正宗",然篆
各向异性磁阻(Anisotropic magnetoresistance,AMR)传感器凭借其功耗低、灵敏度高、体积小、噪声小、可靠性高及能够适应多种恶劣环境等优点被广泛应用。镍铁合金薄膜材料是目前应用最广泛的各向异性磁阻效应传感器的材料之一,因为其具有价格低廉、AMR效应比较可观、矫顽力低、灵敏度高和饱和磁场低等优点。对各向异性磁阻薄膜的磁化过程以及各向异性磁阻进行数值模拟研究,对于提高各向异性
<正>上文我们看到发展区块链的重要性与促进区块链产业融合发展的重要意义和广阔前景,那么区块链到底是什么样的技术,它的本质是什么?它的基本机构和关键机制是什么,又有哪些
在明确理解党和国家提出的新时代数学教育教学改革与发展的新任务、新要求的基础上,提出中学数学名师工作室在今后一段时间需要研究的一些课题,并对数学教育教学研究应该坚持
分析了大方县达溪镇冷底小学14例乙型流感暴发疫情的流行病学特征,对疫情控制措施作出评价。采用描述性流行病学方法对14例暴发疫情进行分析,采集患者鼻咽拭子进行病抗体学快
【正】 在中国现代文学上,鲁迅是第一个具有现代意识的伟大作家,也是第一个走向世界的伟大作家,在本世纪的最初年代,鲁迅便以其小说创作,实现东西文学的历史性汇流。毋庸置疑
党的十一届三中全会以来,中国共产党始终坚持马克思主义基本原理与中国具体实际相结合,不断加强主流意识形态建设,实现了社会主义主流意识形态的历史性嬗变与创造性重构,并积累了