【摘 要】
:
人类获取信息的方式多种多样,而90%左右的信息来源于人类的视觉信息。在视觉信息中,汇聚了人类结晶的文字信息往往比其他信息的信息量更大。因此,读取并理解图像中的文本信息
论文部分内容阅读
人类获取信息的方式多种多样,而90%左右的信息来源于人类的视觉信息。在视觉信息中,汇聚了人类结晶的文字信息往往比其他信息的信息量更大。因此,读取并理解图像中的文本信息显得尤为重要且充满意义。传统的OCR技术已经在印刷体识别上趋于成熟,但在自然场景下读取文本信息仍面临着很大的挑战。在自然场景中,光线条件弱、天气状况差、文本扭曲模糊等不利因素都将影响我们有效的获取自然场景中的文本信息。近年来,随着计算机技术和硬件的快速发展,基于深度学习的自然场景下图像的检测与识别技术较传统的OCR技术有了较大的提升。在文本的识别领域中,端到端的CRNN文本识别模型一直占据着主导地位,但是该模型的损失函数CTC计算复杂且计算量大,并且不能解决二维图像的识别问题,虽然通过Attention机制可解决二维识别问题,但产生的文本对齐问题却降低了识别的精度。本文通过引入聚合交叉熵损失函数,可有效解决损失计算复杂的问题,该损失通过字符个数监督的方式还可延伸至二维图像的识别上。本文的主要创新点包括:1.提出一种基于聚合交叉熵损失的文本识别模型,该模型采用Dense Net作为基础网络提取文本特征,并将提取的特征送入双向的GRU以进一步提取文本的上下文特征,最后通过聚合交叉熵损失函数进行损失计算。该模型在一维图像的识别上表现出了与CRNN相抗衡的表现,并且可延伸至二维图像上进行文本识别。2.提出一种端到端的自然场景下文本检测与识别模型,该模型基于EAST的文本检测方法,通过FCN的方式提取文本区域特征,再将获得的文本区域送入我们基于ACE损失的识别器中进行统一训练。该模型在文本的检测与识别上取得较好的效果,在模型评估中,该模型的F-score大于50%。3.使用Py Qt5开发工具开发了一款基于端到端的自然场景文本检测与识别系统。该系统包含图像信息获取模块、图像处理模块、图像检测与识别模块、结果展示等模块,不仅可以完成对图像的基础检测与识别之外,还可以通过选择不同的检测或者识别模型来对图像的检测或识别效果做对比。
其他文献
海底油气管线承担着输送油、气、水及其他化学药剂等的重要功能,海底管线的检测和维护作业多使用水下巡线机器人来进行,水下巡线机器人的自主巡线多依据光学系统来实现,因此
豇豆属植物具有较高的利用价值,目前对其耐盐特性研究较少,在土壤盐渍化日益严重的情况下,不利于豇豆属植物的推广和利用。本论文以6种豇豆属的植物为试验材料,进行盐胁迫处
目的:观察化痰逐瘀汤治疗原发性高血压痰瘀互结证的临床疗效。方法:收集2018年5月~2019年12月在重庆市垫江县中医院心病科住院及门诊部就诊的60例符合纳入标准患者,按照Doll’
何思敬曾经被毛泽东称为“中国一流的法学家”。但查阅知网等学术网站,却发现学术界迄今没有一篇研究何思敬法律思想及其法律工作实践的论文。本文以何思敬的生平、法律工作
目的:应用回顾性队列研究方法,对乳腺癌术后肝郁气滞证患者西医治疗组和逍遥散加减联合西医治疗组进行分析,比较两种治疗方案的优劣,为优化乳腺癌术后肝郁气滞证患者治疗方案提供相关证据支持。方法:采用回顾性研究的方法调取2009年09月30日至2019年09月30日就诊于江门市五邑中医院胸外科及肿瘤科符合纳入标准的肝郁气滞型乳腺癌术后患者作为研究对象。根据治疗方案的不同,将纳入的患者分为西医治疗组和逍遥散
目的:以建立慢性根尖周炎动物模型为基础,研究IL-33与大鼠慢性根尖周炎的相关性,并系统深入的探讨IL-33在慢性根尖周炎骨吸收中确切的调控机制,通过检测IL-33、ST2、RANKL、OPG、Runx2和Osterix在慢性根尖周炎动物模型中的表达情况,进一步研究IL-33和其受体ST2在介导慢性根尖周炎牙槽骨吸收或形成过程中发挥的作用。方法:选择30只雄性SD大鼠,体重在250-350g,随机
目前,我国近海一次勘探已经基本完成,地震勘探正向深水及超深水海域发展,我国的深水油气田主要分布在南海,在南海已经相继有了多个发现,因此对深水资料处理的要求也越来越高,
目的:基于基因型-组织表达数据库GTEx、肿瘤基因组图谱TCGA等多种来源的公共数据,分析核酸外切酶1(Exonuclease 1,EXO1)基因在正常人体和多种肿瘤中的表达特征,重点关注其在肝癌中的异常表达、临床和预后意义及其可能作用机制。方法:利用GTEx网站分析EXO1在正常人体细胞/组织/器官中的表达情况,利用HPA数据库分析EXO1在正常和肿瘤细胞内的定位,利用TCGA门户网站UALCA
氯代苯胺是一种用于橡胶、粘合剂、纺织、涂料、纸浆以及药物合成等领域的化工中间体。在其制备方法中催化加氢是制备氯代苯胺的有效技术路线。在此项技术中,设计与制备高活
目的本研究通过体外细胞实验,观察姜黄素联合铂类化疗药物卡铂对宫颈癌Hela细胞增殖抑制、凋亡及细胞周期的影响,研究两者联合对宫颈癌Hela细胞放射增敏效果。探讨姜黄素联合卡铂应用于宫颈癌放射增敏的可行性,为宫颈癌放射治疗提供新的思路及理论基础。方法1.CCK-8法观察不同浓度的姜黄素(5、10、20、40、80μmol/L)和卡铂(10、20、40、80、150μg/ml)对宫颈癌Hela细胞分别