【摘 要】
:
古籍作为中华文化的重要载体,历史手写古籍文本图像的数字化对于保护文化遗产很重要。而且,从数字化获得的古籍文本图像的转录对于提供对这些古籍文本内容的有效信息访问是必要的。这些古籍文本的自动转录由手写文本识别(Handwritten Text Recognition,HTR)系统执行,该系统通常由光学模型,字典和语言模型(Language Model,LM)组成。目前HTR已成为模式识别和计算语言处理
论文部分内容阅读
古籍作为中华文化的重要载体,历史手写古籍文本图像的数字化对于保护文化遗产很重要。而且,从数字化获得的古籍文本图像的转录对于提供对这些古籍文本内容的有效信息访问是必要的。这些古籍文本的自动转录由手写文本识别(Handwritten Text Recognition,HTR)系统执行,该系统通常由光学模型,字典和语言模型(Language Model,LM)组成。目前HTR已成为模式识别和计算语言处理领域的重要研究课题,但在图像和语言建模问题上,HTR系统仍然面临着一些挑战:(1)手写古籍文本书写随意性大,风格迥异,缺乏规范性,导致系统必须应对图像噪声和手写笔划变化;(2)相较于印刷体汉字,手写古籍文本中存在大量的手绘图案,难以辨识;(3)由于历史文献的维护年限较长,历史文档图像可能包含人工操作和墨水渗出而引起的缺陷。因此,在古籍文本图像检测问题上构建一个鲁棒的HTR系统具有现实意义。随着计算机运算能力的提升,深度学习渐渐被重新引入到实际应用领域。近年来,基于深度学习的文本检测在方法和性能上得到了突破性的进展,如今借助计算机视觉技术完成手写体古籍文档的数字化成为了可能。具体而言,本文的主要工作及创新点如下:(1)构建了一个手写体古籍数据集。其中,包含600张彝族经书,500张中文经书,300张西夏文经书和200张藏族经书。按照ICDAR2015数据集标注标准,完成字符级别的位置信息标注。针对手写体古籍文献背景复杂、版面杂乱等特点,提出了手写体古籍数据扩充方法,对图片进行缩放、旋转和色域变化。每次任意选择4张图片进行组合,最终构建出含有四种语言、图片数量为8000张的手写体古籍数据集(Handwritten Ancient-Books Dataset,HWAD),为后续的手写体古籍数字化研究奠定了数据基础。(2)提出了一种新的手写体古籍字符检测模型。考虑到手写体古籍中的字符相对于自然场景中的文本而言,存在字符过于密集、检测目标过小等问题。本文深入分析FCOS(Fully Convolutional One-Stage)的优缺点,在主干网络(backbone)中将每一层都与前面所有层进行通道级别的连接。本文针对字符目标过小问题,改进了原有特征融合方法;针对文本类别不一导致字符大小复杂多变问题,引入DCN(Deformable Convolution)改进特征提取方式;针对文本长宽比不一问题,使用CIOU改进文本框回归损失函数,本文将这种新的字符检测模型命名为DFCOS(Dense Fully Convolutional One-Stage)。该模型不仅能满足检测的实时性,还能提升字符的检测精度。在手写体古籍数据集上的实验结果表明,本文提出的模型优于现有的文本检测模型。(3)优化后处理算法。基于手写文字的随意性,某些单个文字容易被预测成多个文字,同时较长较宽的文字也可能不能完全被文本框框住,从而形成过切分和欠切分的现象。本文提出的后处理方法考虑了上述两种情形,使用SoftNMS(Soft Non-maximum suppression)算法进行后处理。经试验表明,该方法有效的解决了过切分和欠切分的问题。针对以上创新点,本文设计并实现了手写体古籍文本检测系统,将训练的文本检测模型进行封装。后端采用Django框架,前端采用Html、CSS和Java Script。通过实验反复迭代,验证了DFCOS模型的鲁棒性和准确性。
其他文献
Understanding by Design(UbD)模式,是一种以逆向思维为主导的教学设计模式,它最先被美国课程专家威金斯和麦克泰格提出并进行了操作性的定义,它是把学习结果作为教学设计的起点,并且强调评价先行的一种具有较强创新性的教学设计模式。通过在教学中运用UbD模式不仅可以满足学生的实际需求,而且可以促进学生多个方面能力和综合素养的培养和提高,具有较好的教学效果。由于我国不断地在进行课程的
《普通高中地理课程标准(2017年版)》提出地理课程旨在培养学生的地理核心素养,并鼓励地方开展地方课程和校本课程,以满足学生兴趣培养和个性化发展的需要。乡土地理教育在提高学生地理实践能力、培养学生热爱家乡的情感、提升地理教师专业素养和丰富乡土地理课程资源等方面具有重要意义。运城盐湖因其历史价值和资源属性而备受关注,但缺乏适用的乡土地理课程。因而,本文的研究对于开发运城盐湖的乡土地理课程资源,促进乡
二十一世纪是一个技术进步和全球化扩散的时代,教育下一代学生掌握科学技术,培养综合素养高的人才是当今社会物理教师的使命。其中,STEAM教育在近几年引起了大量学者和专家的关注与研究,它强调:不仅要培养学生的科学素养、动手能力、工程意识、把数学运用于科学探究的能力,还要重视知识的人文素养、教育的艺术性和创造性。学习物理学的重要方式之一是通过实验探究活动,在初中物理学习中,许多的物理规律都是以实验为基础
近年来,大数据、人工智能等技术已经成为引领科技革新的重要驱动力量,人工智能与教育的深度融合推动着在线教育发展成为一种新的教学模式。然而,随着网络资源指数式的增长和愈加多样化,用户很难及时、有效地获取需要的信息,信息过载带来的问题日益突出,如何有效解决海量数据导致的信息过载问题已成为各大平台研究的热点。本文对现有平台和推荐算法进行了分析研究,针对现存不足提出了融合辅助信息的深度分层注意力推荐算法并设
图像拼接是指利用坐标变换的方式将数张互有重叠的图像拼接为一张新的视角更大的图片的过程。该技术自诞生以来就备受科研人员的关注,迄今为止已出现了许多优秀的算法且落地了大量成熟的应用。例如能在低速情况下为司机提供车身周围全部信息的全景泊车系统;以及为方便客户参观而将样板房实景拼接成全景图片的虚拟房源;亦或是能让医生直观分析病情而缝合出的宽视角医学图像。然而传统的图像拼接算法是以图像本身为基准,通过搜索图
近年来,卷积神经网络(Convolution Neural Network)在图像识别、自然语言处理、目标检测等多个领域中取得了广泛的研究和应用。在图像识别领域,卷积神经网络与数字病理(Digital Pathology)的结合,使得医学影像的自动化分析成为可能。将卷积神经网络应用到肺纤维化病理图像(Whole Slide Image)的分析任务中,进行肺纤维化病变程度的诊断,能够减轻病理医师的工
2018年,教育部颁布《普通高中地理课程标准》,明确将人地协调观、综合思维、区域认知和地理实践力作为高中地理教学的学科核心素养。此后,学生地理核心素养的培养成为高中地理教学最主要的任务之一。教育公平是国家的基本教育政策,对地理学科后进生的培养符合教育公平的观念,而且“后进生”在每个学校都是存在的,这部分学生大多因为转化难度大而逐渐被教师放弃,以致于对其成长之路造成较大的影响。为促进后进生全面发展,
桑叶(Folium Mori)在我国种植范围广泛、年产量大且营养价值丰富,是一种物美价廉的功能性食品,有着极高的食用与药用价值。但是在开发桑叶食品的过程中,由于桑叶挥发性成分复杂,且存在较重的草腥味,导致部分人群对其难以接受,阻碍了其在食品领域的发展。因此,对于桑叶的加工工艺进行研究有助于桑叶的开发利用,为今后桑叶深加工提供一定的参考。本文以5种乳酸菌分别发酵桑叶,筛选出在桑叶培养基中能够生长良好
数字信息化时代,让计算思维成为21世纪创新型人才所必备的思维能力之一。人工智能时代的到来,让编程教育受到重视。在大量的研究中,计算思维的培养和编程教育是相结合的,即用编程教学来培养学生的计算思维,锻炼编程能力。对于高中学段而言,《普通高中信息技术课程标准(2017年版)》要求信息技术学科培养学生的计算思维。与此同时,Python这一编程语言,因为其有语法简洁等特性,也因为新教材中有相关内容,逐步进
核桃破壳取仁是提升核桃经济价值和产业化发展的重要环节。目前国内的核桃破壳加工多依靠人工,存在破壳效率低、劳动强度大等诸多问题,实现机械化的核桃破壳取仁是未来产业发展的必然趋势。然而市场上成熟应用的核桃破壳取仁设备鲜有,因此,亟须开展核桃破壳设备的研究工作。参照前人众多的设计经验,本文创新性地设计了一款能实现核桃自分级筛选以及利用间隙挤压破壳的设备。针对所研究问题,本文主要做了以下工作:1)对核桃的