面向教辅文档的图像检索研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:zhubob2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络教育平台以及教辅APP的蓬勃发展,带来的是电子化教辅文档图像数据的大规模增长,对于教育工作者和学生来说,在这些规模庞大的图像数据库中找到自己所需要的教辅文档图像是件十分费力的事情,所以也就产生了面向教辅文档图像数据的图像检索的需求。本文介绍了文档图像检索的国内外研究现状并通过分析当前教辅文档图像数据的特点,设计一种面向教辅文档图像的检索系统,主要工作为以下几点:(1)设计了面向教辅文档图像的图像分割算法。在教辅文档图像数据中,包含印刷文字信息、手写文字信息、自然图像以及公式、表格之类的特殊图像,在这些信息中,手写文字信息对于教辅文档图像检索是没有帮助的,还会影响到检索性能。所以需要将这部分信息进行筛除。本文通过分析教辅文档图像数据的特点,设想了两种思路对本问题进行解决,第一种思路是将这些信息当作图像中的目标,然后使用目标检测算法对其进行提取,并对其中手写信息类别的目标进行剔除,本文基于这种思路设计了一种基于Retina Net的图像分割方法;第二种思路是将图像中像素进行分类,即语义分割的方法实现对不同的信息块的分离,本文基于该思路设计了基于U-Net的图像方法,并设计了损失函数以适用于本任务,并对图像分割结构进行后处理,提高结果精度。(2)设计了基于BOW的教辅文档图像检索算法。一般的可视化词汇的图像检索方法是对图像进行分块,然后特征提取,构造可视化词汇词典,进行检索。但是针对在教辅文档图像数据中,存在着大量的无意义的图像块,包括大量的空白背景等。本文通过上阶段图像分割的结果,将教辅文档图像中具有实际意义的图像块提出,并在这些图像块上进行特征提取,并采用SURF特征和MSER特征结合的方法,能够得到分辨能力更好的特征,从而得到更好的图像检索性能。(3)设计并实现基于教辅文档图像的检索系统。对用户提交的待检索的教辅文档图像数据,使用基于本文设计的分割算法,将图像数据进行分块过滤手写信息,再通过本文设计的图像检索方法,对图像进行检索,将结果可视化的返回到用户界面。
其他文献
教育机器人项目在“新工科”工程教育改革中的作用十分显著。机器人在教学中的主要作用之一是把机器人作为编程仿真平台。目前,采用开源机器人操作系统ROS的移动机器人在各行业得到迅速发展应用,移动机器人及其智能感知与规划对于培养学生计算思维、解决问题的能力具有独特的优势。本文设计与开发了基于ROS的轮式移动机器人仿真平台,并通过联机实验产生其具体的物理表现。主要研究内容如下:(1)仿真平台总体框架设计。针
基于视觉的目标检测是智能汽车环境感知系统重要组成部分。但是汽车在行驶过程中,传感器搜集到的道路图像会受到了不同环境(比如不同天气、光照条件)的干扰,同时还会受到待测目标被遮挡的影响,这些问题影响着算法准确性和鲁棒性。因此,本文围绕着这些问题,对复杂环境下基于生成对抗网络的视觉增强和视觉感知进行研究。主要研究内容如下:(1)考虑到基于视觉的目标识别对鲁棒性的要求,对不同天气、光照情况下的驾驶情况进行
近年来,机器人代替人工打磨作业的技术由于其高效率、高精度得到了各领域的广泛应用。采用机器人打磨后,打磨时产生的粉尘由末端集尘管实时收集,相较而言,人工打磨时则是通过区域范围的通风集尘来处理粉尘,因而一般认为采用新技术在粉尘防爆上更加安全。但考虑到机器人打磨的高效率、长工时、全自动化、电气控制设备的引入等本身也会使粉尘事故的风险增加,新技术中粉尘风险总体是否升高,采取的措施是否足够抑制风险,仅按照防
家政服务作为民生领域,属于经济新动能,是朝阳产业,在近些年来取得了长足的发展,但仍然不能够满足社会对家政服务的需要。随着我国居民生活水平现代化、人口城镇化的不断发展,家政服务已经是居民生活中不可缺少的组成部分,但是传统的家政服务行业存在很多问题:家政服务行业管理不规范,服务者和消费者之间存在的信任问题,家政服务市场供需矛盾突出等等问题。另一方面,由于经济下行的压力,更多人希望通过兼职的方式发挥特长
单元素二维材料(Xenes)是二维材料家族中的重要组成部分,Xenes拥有许多优秀的力学、电学、光学和热学性质,被广泛应用于各种纳米器件中。最近,一种新的Xene——碲烯在理论上被预测然后在实验上被合成。碲烯拥有多个不同的相,表现出优秀的光学和电学性质,但是关于碲烯的应用研究还处于初步阶段。我们利用非平衡格林函数结合密度泛函理论计算方法研究了基于碲烯不同相的光电和输运器件的性质。我们利用碲烯的两个
物联网的兴起吸引了人们对无线传感器网络的关注,网络中的传感器节点有着供能受限、计算能力不足的特点。一方面,网络服务的生命周期极大影响了其服务质量,另一方面,由于硬件平台日新月异,密码学算法也在不断发展,因此我们需要研究在新的硬件平台下传感器节点的功耗变化,并根据无线传感器网络的特点进行优化。本文针对无线传感器网络中的功耗问题,设计了一个硬件平台用于研究各种密码学算法、密钥管理方案的功耗。首先,阐述
自1980年,von Klitzing等人发现整数量子霍尔效应以来,距今已接近40年。整数量子霍尔效应的发现为后来各种量子霍尔现象的发现开辟了道路,尤其是分数量子霍尔效应的发现。同时,分数量子霍尔效应的发现推动了强关联电子系统理论的发展,特别是,它揭示了各种概念的实际存在,而这些概念以前只是理论想象的产物。在这几十年的时间里,科学家们在这一领域做出了很多突出的贡献并且不断的向前发展,许多以前只存在
"随班就读"学生大多在语言方面发展滞后,感觉统合失调现象比较普遍,学校通过"语文实践活动中的融合课程",把语文实践活动与感觉统合训练结合起来,在语言发展的同时促进特殊儿童运动协调、空间感知以及视听能力的提升。第一,课程安排注重针对性。单独辅导与团体辅导相结合,力求实现教学效果最优化。单独辅导主要关注学生的个体需求和发展,要了解每一个特殊儿童的特点,制订个性化成长方案。
期刊
随着现代科学技术的不断发展,各种电子器件设备已经向微型化,集成化发展,功率密度迅速提升。方便而准确的测量各种不同尺寸和物相的材料的热导率成为了解决元件热量管理问题的重要问题。而3-Omega技术作为一种适用范围广,准确度高,成本相对较低的热物性测量方法,对其进行深入研究和测试技术优化具有重要的意义。本文首先介绍了材料热物性研究的意义以及一些常见的热导率测量方法,通过对比各个测量方法,明确了3-Om
近些年,随着电力电子产品种类、数量的增多,以及电力电子技术的快速发展,人们对电源系统的要求越来越高,对电源系统的功率、效率以及可靠性提出了更高的要求。但是在实际生产应用的过程中,受到目前工艺制造水平的限制,每个电源模块的固有参数并不完全相同,如果只是将电源模块直接并联使用,会带来很多的问题,如模块间负荷分配不均,并联电源系统输出电流的纹波较大等。因此,必须对并联直流电力系统采取一定的负荷分配策略,