论文部分内容阅读
诗歌是一种有着特殊魅力的文学体裁,是一种人类文明发展的象征。在当前时代下,使用计算机对散文诗进行模拟生成成为自然语言生成领域的一个挑战。本文通过建立散文诗语料库,基于深度学习模型进行散文诗创作,实现散文诗的计算机辅助创作。它可以为广大的散文诗歌文学爱好者提供很大便利,同时也有助汉语言的传播与宣扬。本文针对中文散文诗的创作,对计算机自动生成散文诗进行了研究,首先分类和总结了诗句自动生成领域的研究成果,对深度学习的相关基本概念和具体结构和训练方法进行了讨论。在此基础上,提出了基于主题模型和深度学习相结合的诗歌生成方法。通过对散文诗逐句分割以及对每个诗句进行分词处理后,在已有给定主题的语料文档上,针对分词结果采用基于主题模型特征进行同一主题聚类。该方法依赖于词组短语自动索引的统计信息,有效地解决散文诗生成过程中同义词、多义词的词组短语聚类问题,建立了较为完备的知识语料库。该方法在散文诗的自动生成过程中,通过改进卷积神经网络的特征提取层得到上下文结构模型。这种方法不同于传统朴素贝叶斯的概率模型,实现了基于n-gram的计算,通过顺序合并相邻结果向量,得到诗句文本的连续向量表示,较好地获取了长句子的特征信息。然后将上下文结构模型输出向量作为生成模型的输入,利用权重化LSTM模型进行输入并且循环计算得到句子输出,实现具有良好上下文关联的散文诗自动生成方法。最后,采用BLEU自动评测和人工评测两种互补方式设计实验以及进行图灵测试,建立起较为标准的评价系统。实验结果表明,该方法建立的模型和设计的系统较好地实现了散文诗的计算机自动生成,为今后进一步研究提供了理论和实验基础。