图像生成诗歌的端到端模型研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:tywuyaohuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
诗歌是璀璨中华文化的瑰宝,历史长河中有无数诗歌被传颂至今,人们被前人的智慧和诗歌的美所撼动。在人工智能的大浪潮下,图像识别、自然语言处理、字幕挑战等计算机技术发展迅猛,让计算机自动生成诗歌的研究取得不断的突破。前人在诗歌自动生成的研究大多数在于从文字启发生成诗歌,极少学者研究是从图像启发生成诗歌。目前,从图像启发生成诗歌的研究中存在不少的问题,例如缺乏一个从图像输入直接输出诗歌的端到端模型、输出诗歌内容与图像表征不符、输出诗歌质量不好等问题。本文的主要工作如下:(一)本模型框架基于编码器-解码器,编码器使用全卷积网络FCN,解码器使用长短期记忆网络LSTM。使用FCN编码器从像素级图像中提取空间视觉特征和语义表示。基于FCN-LSTM的编码器-解码器模型框架被运用在图像启发生成诗歌的工作中;(二)模型引入注意力机制,通过细粒度和语义引导的注意力机制,将FCN编码器的所有输出的特征信息汇总到一个联合上下文汇总层中,为解码器LSTM提供更利于诗歌生成的信息;(三)在LSTM解码器中引入内存模型,使得本模型输出的诗歌更具备多样化、创造性;构建图像-诗歌的数据集,为图像生成诗歌的端到端模型训练做准备。设计三个模型评估实验:模型结构分析、诗歌图灵测试分析、多模型对比分析,并详细分析实验数据。在结构实验中,模型引入注意力机制和内存模型后困惑度PPL值下降明显,证明基于本模型输出的诗歌质量更好。在图灵测试中,在非专业组大概有44.8%的诗歌被认为是机器生成诗歌或者不能区分,证明本模型生成的诗歌与人类创作的诗歌水平差不多;在诗歌生成质量的多模型对比中,本模型的主客观评价指标中表现优秀,相比于传统SMT模型有较大进步;本模型并在五言律诗和七言律诗的诗歌评价中,诗歌的连贯性均比注意力机制模型ANMT高出0.03,在诗歌的意义性高出0.17和0.09。
其他文献
在小学阶段的识字写字教学中,探求从学生的身心发展出发,采用多样化的教学方式,为学生谋求一个良好的成长环境。而信息技术的发展,为学生的识字写字教学注入了新的活力,改变
<正>目的考察不同厂家生产的克林霉素磷酸酯注射液的质量及临床用药条件下的稳定性,为临床用药提供参考。方法测定不同厂家生产的克林霉素磷酸酯注射液的含量和有关物质;在临
会议
目的:探讨双侧子宫动脉栓塞治疗难治性产后出血的临床疗效.方法:选择3例产后出血药物治疗无效的病例,用Seldinger技术完成双侧子宫动脉插管、造影,确认后注入明胶海绵颗粒栓
在柴达木盆地北缘,尕丘1井首次钻遇了石炭系海陆交互相地层。该井石炭系烃源岩的碳质泥岩有机碳含量平均为1.85%,灰岩有机碳含量平均为0.42%;灰岩母质类型属于Ⅱ型干酪根;烃源岩成
鉴于当代企业发展过程中员工向心力不足,尤其是基层员工集体意识缺失问题,运用ERG理论从员工自身思想道德素质、企业文化和社会背景等方面,分析出现该现象的原因并借鉴成功企
企业财务管理目标是企业财务管理的一个基本理论问题.它不仅决定着企业财务管理的基本方向,而且还是企业财务管理活动的出发点和归宿点,对整个企业财务活动具有根本性影响.近
本文应用塑性加工力学理论分析了拉延变形过程,根据拉延变形的实际情况,建立了位移和凸缘半径之间的关系,然后利用轴对称变形几何方程,求出了拉延变形的应变与凸缘半径之间的
夫妻财产制是婚姻法学领域一项十分重要的制度,是婚姻中夫妻权利义务关系的重要组成部分。本文根据2001年《婚姻法》的规定和当前的实际,对我国夫妻共同财产制、约定财产制以
我院于 2 0 0 0年 1月至 2 0 0 3年 9月 ,采用两性霉素治疗该病 42例。现将结果报告如下。1 资料与方法1 1 一般资料 男 3 0例 ,女 12例 ,平均年龄 62 5岁。白色念珠菌 2
档案馆的功能不仅仅取决于学术圈和实践界的讨论和研究,更需要得到不同利益群体的认同。文章以《人民日报》1209篇相关报道数据为基础,采用内部职能化和外部社会化的理论框架