论文部分内容阅读
中国古诗是中华文化中的一份瑰宝。近年来中文七言绝句诗生成任务逐渐成为NLP领域一个重要的研究课题。当前绝句诗生成领域仍存在以下四个问题:缺少使用基于Transformer的模型解决该生成问题的尝试;可控绝句诗生成算法的控制准确性和灵活性不佳;几乎没有藏头诗生成相关的研究;缺少在嵌入式开发板上对深度学习压缩、部署并实现对话机器人的研究。为了解决上述三个算法问题和一个工程问题,本文所作的工作如下:第一,针对普通绝句诗生成任务提出并实现TransPoetc算法。在BART模型的基础上,引入一个高斯分布建模先验分布,提升了生成多样性。与基线模型的对比实验以及人工评测表明,TransPoetc具有和业界最好模型相当的生成质量,且生成的多样性更好。这是该领域中,首次尝试预训练模型与CVAE结构相结合来做诗句生成。第二,针对情感可控绝句诗生成任务提出并实现sentEnhancedPoet和multiVAEPoet两个算法。从两个角度有效解决了绝句诗生成情感控制难的问题。人工评测的结果表明,两种算法分别在整诗粒度和句粒度的情感可控度上高出基线模型3.4和4.6个百分点。同时这是该领域中,首次使用多VAE结构解决可控生成问题。第三,针对藏头诗生成任务提出并实现了 headHiderPoet算法。在CVAE结构上,通过引入一个对抗网络,显著提升了生成诗和藏头词的语义一致性。消融实验表明改进后模型生成结果的连贯度和表意度均有相当的提升。这是该领域中,首次用对抗训练的方式解决藏头诗生成问题。第四,将以上所有算法在NVIDIA Jetson Nano开发板上实现全部功能。通过编译Kaldi离线语音识别框架和语音合成工具实现了离线语音识别,通过TensorRT模型转化实现了模型压缩,期间为torch2trt官方贡献了 GRU算子,最终在嵌入式开发板上完整实现了支持多模态交互的作诗机器人。系统测试结果表明,机器人完整实现了多模态交互作诗的功能,且资源消耗和算法推理耗时均控制在了可接受的范围里。