【摘 要】
:
随着互联网和信息化的发展,网络中的信息量与日俱增,给我们生活带来极大的便捷。目前记录信息的方式有文字、图片和视频等多种形式,但我们仍主要以文字作为信息记录的载体。自然语言处理是一门融合人工智能以及语言学的交叉学科,通过表示、分析和处理文本信息,突破计算机和人类的交互方式。从大量文本信息中挖掘发现有用信息已经成为许多研究者的研究方向,实体关系抽取是自然语言处理中的一个研究方向,通过从包含命名实体的句
论文部分内容阅读
随着互联网和信息化的发展,网络中的信息量与日俱增,给我们生活带来极大的便捷。目前记录信息的方式有文字、图片和视频等多种形式,但我们仍主要以文字作为信息记录的载体。自然语言处理是一门融合人工智能以及语言学的交叉学科,通过表示、分析和处理文本信息,突破计算机和人类的交互方式。从大量文本信息中挖掘发现有用信息已经成为许多研究者的研究方向,实体关系抽取是自然语言处理中的一个研究方向,通过从包含命名实体的句子中预测它们之间的关系,将非结构化的句子表示成实体关系这样的结构化信息,以方便计算机对其进行进一步的存储和计算。传统实体关系抽取任务主要通过人工发现和建立表示实体关系的特征或者通过核函数进行关系抽取,其结果受到特征多少和核函数选择影响,往往只能应用于特定领域的关系抽取。随着深度学习在关系抽取上的应用,卷积神经网络、循环神经网络以及注意力模型被引入应用于关系抽取,通过神经网络获取表示句子中实体关系的特征,完成关系抽取任务。相比于传统的实体关系抽取算法,基于深度学习的实体关系抽取算法通过神经网络的学习能获取表示实体关系的特征,具有更优的结果。针对以上情况,本文提出一种新的基于注意力机制的实体关系抽取模型。该模型将句子以实体为基准进行切分,通过基于句中词汇与实体间联系的注意力模型获得句子的向量表示,进而获取实体间关系特征,实现句中实体间关系的预测。通过注意力机制,模型可以获取实体关系相关的特征数据,能去除句子中与实体关系无关的噪音数据,提高模型对句子中实体间关系的预测能力。为了进一步提高模型的结果和加快训练过程中收敛速度,在本文的注意力模型基础上,我们借鉴了实现生成对抗模型的思路,实现了基于生成对抗思想的实体关系抽取模型。该模型分为实体关系抽取和生成实体关系特征两个部分,在训练过程中分别使用不同的损失函数进行误差反向传播。基于此,使得模型的两个部分能够在训练过程中共同提高,从而得到不错的实体关系抽取模型。最后本文设计实现了一个通用的实体关系抽取框架,在其基础上能快速实现实体关系抽取算法并进行结果分析比较。该框架对数据集以及结果分析的统一处理,实现对模型训练过程的中断与继续,使用模块化的设计方案方便算法模型的实现。基于此我们设计实现了一个通过输入包含实体的句子输出预测实体关系概率的模型,进而能直接观测模型的输出。
其他文献
近年来,随着企业竞争力不断增强和“走出去”战略的实施,我国的开放发展模式由以资本的输入为主逐渐转变成资本输入和输出并重。我国企业到境外建立公司或开展并购业务等经贸活动的积极性提高,我国对外直接投资流量大幅增长,随着“一带一路”倡议的提出和贯彻实施,“一带一路”沿线国家成为我国企业对外投资的重要区域,税收营商环境是东道国的营商环境里不容忽视的一环,是国际合作需考虑的重要内容,在我国企业“走出去”的过
随着软件开发和互联网技术的飞速发展,软件系统已得到了广泛应用且人们对软件系统的依赖性和要求越来越高,使得软件规模呈现出指数级的增长趋势。动态开放的运行环境和多变的用户需求使得软件系统需在运行过程中调整自己的结构或行为。然而,庞大的软件规模和异构的软件单元间错综复杂的关系导致人为调整软件行为的过程变得困难、易出错且耗费大量成本。因此,自适应软件应运而生,其可根据软件变化调整自身的行为和结构。通常,自
基于低成本、高效率中短距离通信技术实现的感知网络,能够弥补远距离电信网络成本昂贵的不足。具备较强运算能力的IOT(Internetof Things,IOT)网关可以与传感网络节点配合,使网络具有计算、控制、采集、执行等能力。网关节点的移动自组网对实现局部子网连接,拓展中短距离物联网的覆盖范围,具有重要意义。论文设计嵌入式IOT网关并研究网关的WIFI自组网技术。由于嵌入式平台运算能力及能源有限,
肠炎沙门氏菌(salmonella enteritidis)是一种兼性胞内寄生菌,能引起人和各种动物的沙门氏菌病,主要表现为胃肠炎和败血症,是人类食物中毒的主要病原菌之一。肠炎沙门氏菌主要
随着计算机技术的飞速发展与普及,各行各业纷纷利用计算机技术进行产业升级改造。在教育领域,高校的教学模式也在进行着改革,传统教学模式受时间与空间的限制,不能完全满足现代教育的需求。因此,各高校开始借助于计算机技术搭建在线化的教学平台,在线化的教学模式打破了传统教学模式的时空限制,线下的课堂教学得到极大的延伸,减轻了教师教学负担的同时,也提高了学生的学习效率。然而,目前大多数的教学平台只解决了“教”与
资源是企业运营中的必备的要素,是企业的运营、生产、发展等活动的基础。随着时代的变化,企业的发展。资源种类日渐增多。资源关系错综复杂。资源及资源关系的变化对企业的经营产生巨大影响。这种影响造成企业的资源管理难度增大。企业对于资源管理的要求日益增高。对资源的管理逐步成为了企业的核心竞争力之一。本文介绍了一种用于感知资源失效的资源关系模型。资源关系模型可以解决现阶段资源管理理论中存在的问题,包括资源类型
在全域旅游深入实施的背景下,旅游产业的重要地位进一步得到凸显,各省、直辖市、自治区都更加重视旅游产业竞争力的提升,我国也逐步将旅游业培育成为国民经济战略性支柱产业,因此也更加需要相关理论及研究对于实践层面的支持。在以往研究中,对旅游竞争力的研究层出不穷,但在全域旅游的背景之下,在“旅游+”战略逐步深入的形势下,旅游产业竞争力的相关研究还存在空白,各省域在旅游产业发展无法得到最新的实践支持。因此,本