基于生成对抗网络的文本生成的研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:Jany9538235
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在自然语言处理中,文本生成是一个非常重要的领域,它让计算机能够像人一样写出高质量的文本,在摘要提取、文本风格转换、密码破译等方面都有应用。生成对抗网络(GAN)是文本生成中一个很好的工具框架,目前的语言模型由于其离散性,若使用GAN进行文本生成,就无法在模型训练时使用反向传播进行参数更新。并且因为GAN的思想原是学习一个生成模型,让它能够将一个噪声分布映射到先验现实文本分布,而目前的文本生成任务大多是在字符级上进行文本生成的学习,这种学习方式很容易造成生成文本新颖度过低的文本以及模式崩溃的情况。针对以上一些问题,本文提出一种基于生成对抗网络的文本生成模型,为此,本文所做的工作如下:(1)本文基于最优传输和GAN的思想提出了一种新的无监督文本生成模型,将两个不同文本特征分布的距离进行量化,提出了一种新的散度,并将最小化得到的距离作为训练目标来优化生成模型。同时为了让生成对抗网络从连续空间推广到离散空间,本文采用了基于softmax转换的可微函数来逼近原来的不可微函数。为了适应不同样本集,本文将最优传输原始公式中的“代价函数”作为神经网络进行训练,把无监督文本生成任务在MS COCO captions数据集上进行试验,实验结果表明,本文提出的无监督文本生成模型得到的生成文本分布相比于对比模型与真实文本分布相似度更高,并且拥有更高的文本多样性。(2)针对条件文本生成的文本情感风格转换任务,本文使用了自编码器来作为生成模型,并在以上工作的基础上,使用基于最优传输思想的判别器提供的分布间距离作为生成器额外损失项,并使用了一个情感分类器来隐式分离文本内容和文本风格,使得不仅得到目标情感风格的文本,而且也能在最大程度上保留原文本的内容。本文在Yelp餐厅评论数据集上进行实验,相较于基准模型,本文提出的模型在情感准确度和内容保留的评分上都获得了更高的分数。这些实验结果表明了最优传输理论在文本生成研究领域的合理性,为接下来的进一步工作给出了参考。
其他文献
拉米夫定在我国用于治疗慢性乙型肝炎已10年,其快速抑制病毒及服药的安全性已被确诊,被广泛应用于各型慢性乙型肝炎,长期服药过程中发生的耐药,造成病毒反跳肝功反复已成为临床治
摘 要:语文是学生学习理解和运用祖国语言文字的课,是学生听、说、读、写的综合实践课,是引导学生提高语文综合素养的课。说到底,语文是学生用来说、讲、 读、写、用的必然工具。其中阅读教学在初中语文教学,乃至整个教育过程中都有相当重要的地位。 因此,在初中语文的阅读教学中,如何培养学生的阅读能力成为教师必须关注的问题。   关键词:初中语文 阅读能力 师生互动 教学设计  语文是一门综合性、 实践性很强
建立了反相高效液相色谱法(RP-HPLC)测定中华绒螯蟹肌肉、肝胰腺、精巢和卵巢组织内的恩诺沙星、环丙沙星含量。结果表明,恩诺沙星和环丙沙星在四种组织中的平均回收率分别为
中国经济要想实现高质量增长,企业首先需要打破在国际产业价值链中“低端锁定”的地位,提升国际产业价值链。但是作为企业如何提升国际产业价值链,国际产业价值链的提升对企
市场经济的发展导致企业规模越来越大,分工越来越细。最终演化所有权与经营权之间的分离,所有者与经营者之间的委托代理矛盾日益突出。所有者和经营者最终目标不同,双方具有
急性脑梗死(ACI)患者由于存在急性缺血及缺血再灌注的损伤,因此存在严重的炎性反应,机体免疫平衡失调,血浆炎性因子水平升高,抗炎性因子水平降低,进而引起C-反应蛋白水平升高