论文部分内容阅读
在自然语言处理中,文本生成是一个非常重要的领域,它让计算机能够像人一样写出高质量的文本,在摘要提取、文本风格转换、密码破译等方面都有应用。生成对抗网络(GAN)是文本生成中一个很好的工具框架,目前的语言模型由于其离散性,若使用GAN进行文本生成,就无法在模型训练时使用反向传播进行参数更新。并且因为GAN的思想原是学习一个生成模型,让它能够将一个噪声分布映射到先验现实文本分布,而目前的文本生成任务大多是在字符级上进行文本生成的学习,这种学习方式很容易造成生成文本新颖度过低的文本以及模式崩溃的情况。针对以上一些问题,本文提出一种基于生成对抗网络的文本生成模型,为此,本文所做的工作如下:(1)本文基于最优传输和GAN的思想提出了一种新的无监督文本生成模型,将两个不同文本特征分布的距离进行量化,提出了一种新的散度,并将最小化得到的距离作为训练目标来优化生成模型。同时为了让生成对抗网络从连续空间推广到离散空间,本文采用了基于softmax转换的可微函数来逼近原来的不可微函数。为了适应不同样本集,本文将最优传输原始公式中的“代价函数”作为神经网络进行训练,把无监督文本生成任务在MS COCO captions数据集上进行试验,实验结果表明,本文提出的无监督文本生成模型得到的生成文本分布相比于对比模型与真实文本分布相似度更高,并且拥有更高的文本多样性。(2)针对条件文本生成的文本情感风格转换任务,本文使用了自编码器来作为生成模型,并在以上工作的基础上,使用基于最优传输思想的判别器提供的分布间距离作为生成器额外损失项,并使用了一个情感分类器来隐式分离文本内容和文本风格,使得不仅得到目标情感风格的文本,而且也能在最大程度上保留原文本的内容。本文在Yelp餐厅评论数据集上进行实验,相较于基准模型,本文提出的模型在情感准确度和内容保留的评分上都获得了更高的分数。这些实验结果表明了最优传输理论在文本生成研究领域的合理性,为接下来的进一步工作给出了参考。