一种基于细粒度文本分析的可控文本生成模型框架

来源 :中原工学院 | 被引量 : 0次 | 上传用户：sam2009009

【摘要】

：

自然语言处理中很多任务都可以被看作是序列标注(Sequence labeling,SL)问题而得以有效地处理。现有研究大多将这些任务作为独立的序列标注问题来解决,或者以多个辅助任务实

【作者】

：

陈云

【出处】

：

中原工学院

【发表日期】

：

2020年01期

【关键词】

：

联合模型 SA-JSL 自注意力机制可控文本生成生成对抗网络 Gumbel-Softmax

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

自然语言处理中很多任务都可以被看作是序列标注(Sequence labeling,SL)问题而得以有效地处理。现有研究大多将这些任务作为独立的序列标注问题来解决,或者以多个辅助任务实现对某个特定目标任务的性能提高,这些研究忽略了自然语言处理中多个任务之间可能存在的潜在关系和影响。为此,本文提出了一种基于自注意力机制的联合序列标注框架模型(self-attention based joint sequence model,SA-JSL),该模型可充分利用多个序列标注任务之间的可能存在的相互作用和影响,从而实现同时促进和提高各个序列标注任务性能。具体来说,该框架模型通过将自注意力机制和联合标签机制融合,将多个序列任务转换为一个统一的序列标注任务来处理,有效地利用率这些任务之间可能存在的潜在关系,从而实现多个任务相互促进和提高。该联合模型与自注意力机制相结合,获取更加丰富的上下文信息,从而提高模型的性能。为了验证模型的有效性,在七个常见的公开数据集上进行了大量的实验,所提联合学习模型分别在中文分词(Chinese Word Segmentation,CWS)和词性(Part-of-Speech tagging,POS)标注联合学习任务与中文分词和中文命名实体识别(Chinese Named Entity Recognition,CNER)联合学习任务上进行实验,实验证明了所提联合学习模型取得了比单任务和多任务学习更为优异的性能。文本生成任务在自然语言处理中是一项具有挑战性的任务,而将文本生成任务中加入可控属性标签难度系数更大。可控文本生成的定义为文本的学习生成是通过动态的标签属性(如情感标签)控制生成一些符合标签属性的生动真实自然语言句子。为此,本文提出了一种融合自注意力机制的生成对抗网络(Generative Adversarial Network,GAN)实现情感可控文本生成的模型,该模型通过充分挖掘文本中潜在语义信息让语言模型对上下文理解透彻包括对于标签属性的描述的理解,从而让生成器能够生成自然流畅的句子。为了让GAN获取更多的语义信息细节,融合自注意力机制提取局部语义信息,为了解决文本序列离散的属性,将GAN中的Softmax(归一化指数函数)替换成Gumbel-Softmax,这种做法能够让模型在有限的离散型数据上达到很高的拟合效果,从而提高可控文本生成的准确性和流畅性。本文将在改进前的GAN网络与改良后的模型进行实验对比,以及融合自注意力机制之后模型的性能,通过实验证明了本文模型在可控文本生成的性能更加优异。

其他文献

青海盐湖:肩负起中国钾肥生产责任

<正>青海盐湖工业股份有限公司前身为"青海钾肥厂",1996年作为青海省的首批现代企业制度试点单位进行了公司制改造,更名为"青海盐湖工业集团有限公司"。1997年公司将氯化钾生

期刊

青海盐湖工业股份有限公司氯化钾钾肥生产盐湖钾肥

论交际法在大学英语教学中的局限性

本文通过对大学英语教学特点的分析,探讨了大学英语教学过程能否交际化的问题,从理论和实践两方面论述了外语课堂所培养的交际能力与社会交际能力之间的差异,最后指出“弱式

期刊

交际能力教学过程

高校网络语言生活及其规范与引导

高等学校网络语言生活具有平台较为齐备、主体较为年轻、环境较为宽松的特点。网络语言生活对高校师生语言文字综合素质有积极与消极的影响,其积极影响是能够丰富高校师生的

期刊

网络生活语言生活校园语言网络语言语言规范

关键概念与网络时代的科研变革——以E-Science、Science2.0、开放科学、开放创新、数字人文为例

对E-Science、Science2.0、开放科学、开放创新、数字人文这五个表征网络时代科研变革的关键概念进行探析,将网络时代科研变革的趋势概括为:跨越地理位置的协同研究变得越来

期刊

关键概念E-ScienceScience 2.0开放科学开放创新数字人文科研变革

PCAT1基因多态性与肺癌易感性的关系

目的:肺癌是恶性肿瘤高发病率和高死亡率的主要原因之一,是严重威胁人类健康的重大公共卫生问题。长链非编码RNAs是一类新的潜在生物标志物和癌症治疗靶点。研究已经表明长链

学位

PCAT1多态性肺癌易感性交互作用

中国农科院肥料应用工程技术研究中心主任张树清:肥料功能添加剂的应用与效果

<正>肥料添加剂,用于改善肥料性能、促进肥料功效、分解残留农药、硝酸盐和改善土壤环境的化学物品。目前肥料添加剂在种类上可分为,一、肥料性状改良;特别是针对水溶肥料,对

期刊

肥料添加剂工程技术研究中心功能添加剂农科院应用与效果

经自然腔道取标本手术（NOSES）对比传统腹腔镜手术（CL）治疗结直肠癌临床疗效的Meta分析

目的结直肠癌(colorectal cancer,CRC)是目前全球常见的恶性肿瘤之一,随着微创外科和加速康复外科的发展,治疗结直肠癌的手术方式也在不断改变与完善,在近期疗效、远期疗效方

学位

结直肠癌经自然腔道取标本手术(NOSES)腹腔镜结肠癌根治术Meta分析

转型中的焦虑与建构——论新时期后期童年书写繁荣之成因

回忆性的童年书写在新时期后期蔚然成风,这种童年书写的繁荣与时代文化的转型和文学的嬗变密切相关,映现出普遍存在于创作主体内部的认同焦虑,也反映出他们对生命家园与文学

期刊

童年书写转型认同焦虑主体建构

预压装配式混凝土框架结构半刚性节点刚度退化研究

采用预应力钢筋连接梁柱预制构件可以综合装配式框架和预应力混凝土结构的优点,是近年来新兴的新型装配式梁柱节点连接方式。在预压装配式PC框架结构设计分析中,有关梁柱节点

学位

预压装配式半刚性节点刚度退化刚度折减有限元分析

性别对肝内胆管癌患者肝切除预后的影响

背景与目的:女性的肝细胞癌发病率较男性低,且女性患者的预后优于男性患者,这一现象与雌激素可能具有的保护作用相关。性别对肝内胆管癌(ICC)预后的影响尚不清楚。本研究旨在

学位

肝内胆管癌肝切除术性别倾向性评分肝内胆管结石预后

一种基于细粒度文本分析的可控文本生成模型框架

其他学术论文