自然场景中文本检测识别系统的设计与实现

被引量 : 8次 | 上传用户:zjhzjhzjh111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能手机等移动互联网设备以及4G网络等无线高速上网方式的普及,使得人们获得信息的途径越发的丰富、广泛和便捷。图像在传播信息媒介中所占的比例越来越大,已经远远超过传统的文本形式。图像中的文本包含着很多有价值的信息。在图像中可被获取的信息中,人眼的注意力尤其会被文本所吸引[17]。传统的文本检测识别技术专注于扫描文档、票据以及格式统一的文本检测,很少涉及自然场景图片中的文本检测。准确检测和识别自然场景中的文本对于图像的语义理解具有重要意义。本论文的工作内容是基于该作者的实习单位的研究项目进行的。研究重点为移动通信中违规图像的过滤。作者独立完成了以下工作内容:自然场景中文本检测识别系统的设计与实现。作者利用计算机视觉领域的相关知识,采用模式识别和深度学习中的一些算法,从自然场景图片中检测出标识文本,并且通过实验验证了其有效性。系统包括图像的预处理、文本位置检测、文本识别等功能模块。其中,图片的预处理模块对输入数据进行灰度化、增强文本对比度。文本检测模块利用最大稳定极值区域(Maximally Stable Extremal Regions,MSER)算法提取候选区域,并通过深度神经网络提取深度特征。文本识别模块利用识别神经网络进行文本识别,并通过语言模型修正识别结果。自然场景中文本检测识别系统被应用于检测和识别网络图像中的文本信息,提供文本信息线索给违规图像过滤系统。测试结果表明,融合了自然场景文本检测识别系统的违规图像过滤取得了更好的性能,从而达到了设计目标。
其他文献
西藏幅员辽阔,公路桥梁具有数量众多、分布散、使用环境恶劣的特点。常规的桥梁承载能力评定技术在高寒地区具有局限性,仅能评估出桥梁日前的安全状况,不能辨别其今后使用情
<正>患者,女,25岁。初诊日期:2015年8月2日。主诉:月经淋漓不断9个月,加重1个月。病史:9个月前在厦门市妇幼保健院接受剖宫产手术,产后即月经淋漓不断,每日月经量3 mL左右,色
<正>把互联网的娱乐方式带到田野里。从联众1998年开始开发全国类棋牌,到JJ斗地主研发的棋牌竞技比赛,再到2016年闲徕互娱针对地方市场开发的房卡模式,棋牌这个看似老掉牙的
奥卡西平(OXC)是常用的新型抗癫痫药物。本研究前瞻性收集了184例癫痫患者的196份常规监测的OXC活性代谢产物10,11-二氢-10-羟基卡马西平(MHD)血药浓度和相关信息。采用非线性混
目的:对独活寄生汤配方颗粒与传统饮片汤剂治疗类风湿关节炎(RA)的临床疗效进行对比研究。方法:将确诊为RA的250例患者随机分成对照组和治疗组,每组各125例。治疗组用独活寄
民事诉讼财产保全制度在民事诉讼中占有重要的地位,但是纵观我国民事诉讼相关立法,对于财产保全制度的规定仍存在一定程度上的缺失,特别是关于对案外人相关权益的保护上,存在
一股反对道德知识教育的思潮正在我国流行,要求从知性德育向生活德育转化。我国学校道德知识教育确实存在种种问题,但是那些问题并非道德知识教育本身所固有的,而是由被扭曲
<正>现代意义的"分配正义"要求某些资源在整个社会范围内通过国家强制手段进行再分配,以提供给每个社会成员一定水平的物质待遇。此种分配正义的成立,必须满足三个前提性条件
为研究生猪产业链各环节存在的质量安全问题及其原因,在溯源追责的大框架下,基于产业链视角,借鉴社会共治理念,利用对北京市生猪养殖与流通、生猪屠宰加工、猪肉销售等环节利
目的建立生新发胶囊(补骨脂、何首乌、女贞子、当归、天麻、黄精等)的指纹图谱,更好地控制生新发胶囊的质量。方法采用HPLC法,二极管阵列检测器(PADA);流动相为乙腈-0.1%磷酸