基于深度学习的文本处理系统设计与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:ohngahng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能技术的发展,法律、医疗和安全等行业都受到深远的影响。在这些行业中,大部分的数据都能够以文本形式存在,文本处理的目的是更好地管理这些文本并且从文本中获取用户需要的信息,具体是对目标文本进行分类、信息抽取等处理。深度学习已经在语音识别、计算机视觉和机器翻译等领域取得良好的应用效果,同样深度学习也能应用在文本分类等文本处理任务中。文本分类是文本处理中的核心部分,主要任务是学习给定文本的内容和标签,将这种映射关系生成分类器,利用分类器对未知类别的文本进行分类。本文主要研究工作如下:1、利用神经网络模型学习文本中的特征映射,实现文本特征的自动提取。分模块介绍了基于深度学习的文本分类算法原理,深度学习模型主要采用的是卷积神经网络和分层注意力网络。2、在两种深度学习模型的研究前提下,融合多个深度学习模型以提升文本分类的准确率,并且利用公开的中文文本分类数据集进行对比实验。根据实验结论进行分析,卷积神经网络模型分类准确率最低,采用分层注意力网络能在此基础上提升3%,而融合两个模型之后,分类准确率比卷积神经网络提升6%。3、针对法律行业的文本处理研究,设计并且实现了一个基于深度学习的法律文本处理系统。该系统的实现主要是基于深度学习框架TensorFlow,数据集来源于网络上采集的合同模板,采用卷积神经网络和分层注意力网络的融合模型构建分类器,在处理合同文件的同时也能对用户输入需求进行信息抽取,并且匹配到用户需要的合同模板。本文在深度学习和自然语言处理技术的研究基础上,主要进行法律行业的文本处理研究。法律行业的文书,比如裁决文书、合同文本、法律法规等,一般数量庞大、内容复杂,人工处理的方法效率低下,本文基于深度学习算法对法律合同文书进行文本分类、用户需求匹配等文本处理工作,能够提高办公效率和用户体验。
其他文献
随着城市的快速发展,城市可利用的土地面积不断减少,为了保证城市可持续发展需要,高层建筑变得多起来,很多城市高层建筑已经成为一个区域的地标,代表着城市的良好形象,但是,
阴道炎又叫阴道炎症,一般健康的妇女由于其阴道前后壁紧贴、阴道口闭合、阴道酸碱度平衡等因素,使适应碱性环境的病原体无法繁殖,因此对病原体的侵入有自然防御的能力[1]。正常
在知识和人才的激烈竞争中,企业要想获得竞争优势,必须拥有一支高素质的员工队伍,而高素质员工队伍的建立,需要企业不断提高其培训能力,作为引入企业化管理的高速公路管理亦是如此
自我分化是指个体平衡理性与情感、亲密与独立之间关系的能力,对个体的心理健康和心理社会发展具有重要影响。作为一种社会规范和道德标准,公平是人类追求的目标。因此,个体公平决策的发展十分重要,越来越受到国内外心理学家的关注。文献表明,个体自我分化水平与其公平决策可能存在着联系。本研究以自我分化理论和公平决策理论为指导,采用调查法和实验法,以五年制大专生群体为被试,系统考察其自我分化的发展及对公平决策的影
随着时代的变革,企业的经营环境也随之发生变化。经营环境的变化,推动了管理科学的发展,战略管理就应运而生。战略管理的核心是要寻求企业持之以恒的竞争优势。竞争优势是一
苏联共产党是世界上第一个执掌政权的无产阶级政党。它以马克思主义作为党的指导思想,把建设社会主义、共产主义作为党的奋斗目标。在长期执政的过程中,作为苏联唯一的执政党
现代图像采集技术的迅速发展,使得各种图像采集技术已相当成熟。随着近年来嵌入式系统的功能不断加强,嵌入式图像采集系统也得到了广泛应用。本文重点在于设计一个基于三星AR
目的观察小儿抗病毒颗粒的解热祛痰、镇咳平喘作用。方法采用干酵母致热造模法观察小儿抗病毒颗粒对大鼠的解热作用,给药剂量分别为4.18、2.09、1.05 g/kg,每天ig给药1次,连
文章结合文献和华西医院实践,探讨科室秘书概念、设置、职责和管理,以及困境与对策,提出了科室秘书及其管理的方向,为深入做好我国医疗机构科室秘书管理提供有益的参考。
土地利用/覆盖变化(LUCC)是国际地圈生物圈计划(IGBP)与全球环境变化的人文因素计划(IHDP)的核心研究计划之一,是全球环境研究的热点和前沿问题,无论是从生态环境的角度还是