【摘 要】
:
互联网的迅速发展使得网络数据呈爆炸式增长,如何在海量文本数据中快速、准确地获取用户需求的信息成为人们面临的一个挑战。搜索引擎为人们查找信息提供了一种便捷的工具,但当查找内容属于边界比较模糊的某一范围时,难以通过关键词对查询或检索条件进行准确定义。因此,如何对这一类关键信息进行界定以及识别定位都存在较大困难。针对以上问题,本文提出样例描述式定义关键信息方法,结合深度学习理论与自然语言处理技术,构建了
论文部分内容阅读
互联网的迅速发展使得网络数据呈爆炸式增长,如何在海量文本数据中快速、准确地获取用户需求的信息成为人们面临的一个挑战。搜索引擎为人们查找信息提供了一种便捷的工具,但当查找内容属于边界比较模糊的某一范围时,难以通过关键词对查询或检索条件进行准确定义。因此,如何对这一类关键信息进行界定以及识别定位都存在较大困难。针对以上问题,本文提出样例描述式定义关键信息方法,结合深度学习理论与自然语言处理技术,构建了两个基于神经网络的关键信息判别模型,以实现文档关键信息准确定位。本文的工作得到了国家重点研发计划项目“内外贯通的审判执行与诉讼服务协同支撑技术研究”(2018YFC0831300)的支持。论文的主要工作如下:(1)针对文档句子级别关键信息查找任务,提出了一种基于注意力机制的关键信息识别方法。该方法从关键信息和候选句子的特征提取出发,利用双向门控循环单元获取二者的语义表示,通过计算文本语义相似度对候选句子进行判别。在文本语义表示方面,设计三种注意力计算方法对文本不同层次的语义特征进行提取。实验结果表明,所提关键信息识别方法能够有效识别文档中的关键信息,与未引入注意力机制相比模型识别准确率有所提升,由此说明注意力机制可以更好地捕获文本语义表示,提高关键信息查找效果。(2)针对前述关键信息识别方法未考虑文档上下文信息的缺陷,提出一种结合上下文的关键信息定位方法。它以构建结合上下文信息及关键信息感知的文档表示为目标,实现文档内部任意片段的关键信息定位。在该方法中,首先采用双向LSTM网络直接对文档进行建模,使文档编码表示蕴含上下文信息。接着利用文档与关键信息之间的双向交互注意力,获得关键信息感知的文本表示。考虑文本表示过程中信息丢失问题,融入自注意力机制增强文档编码。实验结果表明,与前述方法相比,该方法对关键信息识别的准确率和F值分别提高了3.3%和1.6%。
其他文献
研究目的:多发性骨髓瘤(Multiple myeloma,MM)是浆细胞恶性肿瘤,是仅次于非霍奇金淋巴瘤的第二大血液肿瘤。达雷妥尤单抗被证明对新发的不适合移植的多发性骨髓瘤(Transplant-ineligible newly diagnosed multiple myeloma,TNE NDMM)患者具有显著临床疗效,但是中国目前还没有达雷妥尤单抗应用于TNE NDMM的长期药物经济学评价与预
基于偏移正交幅度调制的滤波器组多载波(Filter Bank Multi-Carrier with Offset Quadrature Amplitude Modulation,FBMC/OQAM)系统由于具有更低的旁瓣能量,更稳健的异步传输以及更高的频谱利用率等优势成为能替代正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)的第五代(F
玉东1凝析气藏位于塔里木盆地塔北隆起轮台凸起西端的玉东-英买力地区,于2008年10月通过预探获得发现。经过近几年的评价勘探,气藏地质认识逐渐深化,目前基本探明,初步估算凝
随着科技与社会的发展,人们对于数据传输容量提出了更高的要求。为了满足日益增长的数据传输容量需求,在光纤通信系统中,各种复用技术已经被广泛应用。其中,轨道角动量(Orbital angular momentum,OAM)模式复用作为空分复用(Spatial division multiplexing,SDM)技术的一种新方式,不同的OAM模式具有正交性,理论上具有无穷的拓扑荷数,可极大地提高光纤通信
为进一步做好新时代背景下的社会主义教育,普通高中进行了新一轮的课程改革,发布了新课程标准(2017年版),其中将原来的三维目标:知识与技能、过程与方法、情感态度与价值观,提升为学科核心素养:物理观念、科学思维、科学探究、科学态度与责任。问题式教学作为一种传统的教学方法,至今仍然在培养学生的探究意识、思维能力方面有着重要的影响。研究高中物理课堂中问题式教学的现状,教师课堂提问水平的高低,对丰富问题式
混凝土的中性化是钢筋混凝土结构中钢筋发生锈蚀的前提条件,一般大气环境和酸雨环境均对混凝土结构耐久性带来不利影响。实际工程中大部分钢筋混凝土结构处于受力状态,更甚者
量子通信是现代量子信息领域的研究热点,近年来由于受到国家的充分重视,得到了突飞猛进的发展。单光子探测器是量子通信实验的核心器件,本文主要针对单光子探测器开发了一套精准温度控制系统,并对光电倍增管(PMT)阴极光敏材料的温度特性做了细致深入的研究。主要内容如下:1.全面深入调研了制约单光子探测器探测性能的噪声问题,发现探测器在工作时的噪声绝大部分为热噪声,为降低热噪声对探测性能的负面影响,本文通过设
如果说司法是守护正义的最后一道防线,那么庭审无疑是这道防线中最重要的环节。作为当事人表达诉讼主张、出示案件证据以及辩论对抗的核心场域,法庭审判现场的稳定有序无疑对个案正义的实现及司法权威的保护起着至关重要的作用。然而,近年来网络上不断涌现有关庭审冲突的报道,现行法似乎无法给于法官恰到好处的支持,使得法官时常陷入进退维谷的处境。为此,本文通过对庭审冲突事件的研究,试图在学理上论证强化法官庭审指挥权的
随着国民经济的高速发展,石油作为我国重要能源之一,已处于供不应求的状态,石油的开采及如何提高采收率已成为迫在眉睫的问题,由于储层岩心内部构造复杂,早期二维的检测已远远达不到人们的需求,如今,运用数字岩心技术预测数字岩心内部不可或缺的手段之一,随着数值模拟的逐渐成熟与应用,基于三维数字岩心的物理数值模拟研究已发展成岩石物理研究的最佳方法。由于实际岩心的非均质性,仅通过简单的二维CT图像和简单的算法建
为促进经济发展,各地区积极推进工业化进程,在此背景下国家兴建了大批工业园区,其中不乏一些高污染型企业,此类企业在生产过程中注重经济利益,忽视环境影响,这就形成了工业危