【摘 要】
:
在数字技术飞速发展的今天,互联网、数字媒介、视频媒介等技术的快速成熟使得视觉元素占据了信息载体的很大一部分比重,而文字作为其重要的表现形式也是在不断地发展,呈现多样化的形式。与此同时我国对于字体版权的保护也逐渐严格,近年来发生多起由于违规使用商用字体而被索赔的事件,索赔金额高达几十万到几亿不等,因此对于图片中字体的识别相当重要且具有巨大的商业价值。不仅如此,随着深度学习技术的发展,文档分析技术已经
论文部分内容阅读
在数字技术飞速发展的今天,互联网、数字媒介、视频媒介等技术的快速成熟使得视觉元素占据了信息载体的很大一部分比重,而文字作为其重要的表现形式也是在不断地发展,呈现多样化的形式。与此同时我国对于字体版权的保护也逐渐严格,近年来发生多起由于违规使用商用字体而被索赔的事件,索赔金额高达几十万到几亿不等,因此对于图片中字体的识别相当重要且具有巨大的商业价值。不仅如此,随着深度学习技术的发展,文档分析技术已经从文本识别向着更高级的文档理解发展,挖掘出更多的文字属性特征如字体、颜色等对于版面恢复和文档理解有着极大的帮助。本文在综合研究了国内外现状的基础之上,基于现有的深度学习技术,分别设计了字体识别算法模块和文字颜色提取算法模块,同时结合现在较为成熟的OCR(Optical Character Recognition,光学字符识别)技术和 Flask 后台 Web 框架最终搭建了一套文字字体与颜色识别系统。本文取得的主要研究成果如下:1)提出了基于度量学习的字体识别算法模块。收集了 700种字体,设计自动数据合成算法构建数据集,搭建度量学习网络模型结构实现从输入图片到字体特征的映射,最终通过特征之间的度量实现字体的分类。同时引入识别框架,进一步提高了Top1的准确率,达到69.28%。2)提出了基于文字分割网络的文字颜色提取算法模块。在传统的颜色提取算法中结合图像分割技术,分割出文字所属的区域,有效地抑制了文字背景对于颜色提取的干扰。本文设计的网络结构有两条分支,分别进行原图的信息监督和文字区域的信息监督,实验结果表明本文的网络只需少量的训练样本就有不错的泛化性能。3)搭建了一套文字字体与颜色识别系统。引入成熟的OCR文字识别框架,实现了从图片输入到图中各段文字的字体和颜色识别结果输出的端到端系统设计,最终完成Web端的可视化demo展示。
其他文献
果品产业经济是我国农业经济的重要组成部分之一,果园害虫威胁着果实的总体产量和整体品质,影响果品产业的发展速度和发展质量。因此,在果品种植过程中,准确高效地实现果园害虫的检测对于果园害虫治理和提升果品产业经济效益至关重要。果园害虫的传统检测方法大多依赖于人工方式和传统计算机视觉手段,存在检测效率低、主观性强、可推广性差、检测周期长等缺点,不能满足智能化果园害虫实时检测需要。为了实现更为高效智能的果园
鉴于多媒体内容易修改、复制和二次传播等特点,多媒体版权保护与监管问题是多媒体内容分化流程的重中之重。作为多媒体内容分发系统的关键环节之一,数字版权管理系统确保多媒体内容仅由已授权用户安全地使用。我国的数字版权管理系统逻辑架构在不断完善,对系统在容灾迁移、弹性伸缩和业务扩展性等方面均提出了新的业务需求,在这些方面,传统单一主机的系统部署方式存在着劣势。而随着应用容器化和业务系统云端部署趋势的出现,基
随着卷积神经网络的发展,网络的层数不断增加,参数量与计算量成倍增长,对硬件的存储资源和计算资源要求越来越高,也对神经网络在工业界嵌入式设备、移动端设备和其他资源受限的平台上部署应用带来了诸多困难。因而催生了模型压缩算法,对现有网络的参数进行压缩,从而减少运算次数,提高推理速度。但是目前的模型压缩算法发展还存在着严重破坏网络原有精度、压缩倍数不理想、可选择压缩方式单一等缺陷,针对这些问题,本论文提出
目的:探讨慢性牙周炎所致牙列缺损实施种植修复治疗的效果。方法:2018年10月-2019年10月收治慢性牙周炎所致牙列缺损患者90例,随机分为两组,各45例。对照组实施烤瓷桥修复;研究组应用种植修复治疗。比较两组治疗效果。结果:研究组治疗总有效率高于对照组,差异有统计学意义(P<0.05)。研究组语言功能、舒适度、稳定性与咀嚼功能评分均高于对照组,差异有统计学意义(P<0.05)。结论:将种植修复
随着社会的进步以及汽车产业的不断发展,巨大的汽车保有量对资源、交通、环境带来一定的压力。在传统的驾驶行为中,安全因素是驾驶员系统中最薄弱的环节。智能汽车的出现,极大地缓解了传统汽车所带来的社会问题。研究和发展智能汽车不仅符合当前万物智能化的趋势,也是提高人们智慧,确定安全出行的重要保障。智能驾驶包含三个方面的技术,环境感知、决策规划和跟随控制。作为控制层部分,路径跟踪是实现车辆智能化和实用化的先决
漢語同源詞的分化和漢語詞彙的雙音化一直是漢語史研究的兩個重要課題。這兩個課題對應着漢語詞彙的派生階段和合成階段。以同源詞爲參構語素的漢語雙音合成詞的研究,同時與這兩個課題相關,具有揭示詞彙派生及合成規律的積極意義。第一章緒論回顧前人關於同源詞和漢語複合詞的研究,確定同源詞和複合詞的判斷標準。在此基礎上,介紹關於以同源詞爲參構語素的漢語雙音合成詞的研究現狀,探討可以進一步研究的課題及其研究的意義。接
自主导航是移动机器人自主运行的关键技术,当前自主导航最主流的定位技术是 SLAM(Simultaneous Localization and Mapping),同步定位与建图。球形机器人是一种新型形态的移动机器人,密封性能好,能适应复杂环境。球形机器人在机械结构和运动特性上,相对于传统移动机器人有较大的不同,通用的SLAM方法无法直接适用于球形机器人上,使其SLAM方法设计具有一定的难度和挑战性。
文化产业和旅游产业的融合发展是顺应产业发展规律和响应国家战略要求的必然趋势,对新时代背景下产业结构升级和区域高质量发展有关键作用。2018年文化和旅游部的组建将我国的文旅融合发展推进至快速发展的新轨道,全国各地开展文旅融合的模式探索,同时也掀起学者的研究热潮。长三角地区作为引领全国高质量发展的样板区,更应在文旅融合发展上做好先行示范。目前,关于文旅融合发展的研究主要集中在文旅产业融合机理、路径与水
在地产行业集中度持续上升的整体趋势下,房企发展重心越发向规模发展转移,因此近年房企负债率呈现持续攀升趋势。在当前大环境下,房地产企业应当如何将自身负债率控制在合理区间,来确保企业平稳健康发展成为了一个重要的议题。本文使用2004-2019年沪深A股的房地产企业面板数据,通过经验检验,说明了在房地产企业整体高杠杆的环境下,过高的杠杆率水平反而会抑制企业长期绩效的增长。更进一步,本文将样本根据杠杆率大
如今,不规律的生活方式导致消化道疾病较为常见,而消化道出血是许多消化道疾病的初期症状,不容小觑。安全卫生、无痛无创的无线胶囊内窥镜作为消化道的新型检查方式,虽然给患者带来了方便,但其在工作期间拍摄的海量图片不但增大了医生的工作强度,而且视力疲劳等因素也可能导致人工诊断出现漏诊误诊的情况。因此,本文基于胶囊内窥镜检查图像,针对消化道出血病灶辅助诊断算法进行研究。本文利用深度学习技术,从两方面针对出血