基于深度学习的图像生成技术研究与应用

来源 :电子科技大学 | 被引量 : 14次 | 上传用户：xjfox1986

【摘要】

：

图像生成模型是用于对图像进行概率建模的概率模型,而深度神经网络可以看成是一个非常复杂的、拟合能力非常强的非线性函数,可以用于搭建生成模型来估计概率密度函数的参数。

【作者】

：

虢齐

【出处】

：

电子科技大学

【发表日期】

：

2017年01期

【关键词】

：

图像生成模型深度神经网络变分自编码器视觉属性简笔画

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

图像生成模型是用于对图像进行概率建模的概率模型,而深度神经网络可以看成是一个非常复杂的、拟合能力非常强的非线性函数,可以用于搭建生成模型来估计概率密度函数的参数。图像生成模型可以用于更多不同图片样本的生成,可以用于图像信息的恢复,也可以用于不同模态的图片或者图片与文字、语音等之间的转换,还可以用于预测未来,例如可以根据视频中过去帧和当前帧预测来未来帧。本文首先介绍了生成模型在有监督学习和无监督学习中的定义,分析了为什么要学习生成模型的几点原因,并介绍了生成模型在国内外取得的发展,以及将目前的深度生成模型做了一个简单的分类。然后本文介绍了目前深度学习领域中常用的三种生成模型:深度置信网络、变分自编码器和生成式对抗网络,及其改进和变种。我们提出的方法就是基于其中的变分自编码器。接着为了学习可解释的表达来增强图片生成的可控性,本文提出了一个多任务变分自编码器,对人脸图片和人脸轮廓进行联合概率建模,将人脸图片中的位置信息分解出来,并将人脸视觉属性视为人脸图片的一部分隐藏变化,利用二值属性标注使一部分隐藏变量来捕捉这部分视觉属性信息,这样便可以学习到关于人脸图片的分解的、可解释的隐藏表达。利用这个可解释的隐藏表达可以控制生成图片的一些可解释的成分。也可以对输入图片进行编辑,改变输入图片的某些视觉特性。最后本文对人脸照片在简笔画的条件下进行条件概率建模,并将人脸视觉属性视为一部分隐藏变量,控制从人脸简笔画到人脸照片的合成。实验证明,我们提出的模型可以生成更加自然、更加真实的人脸照片。输入一张简笔画,可以通过调节属性变量,生成具有不同视觉属性的人脸照片。将人脸视为人脸照片的内容,将背景、光照等与人脸无关的因素视为人脸照片的风格,给定一张风格照片,我们的模型可以从任意简笔画合成具有目标风格的照片。

其他文献

新活素治疗顽固性心力衰竭的护理观察及体会

目的探讨新活素治疗顽固性心力衰竭的护理方法。方法遵医嘱使用新活索治疗心衰的同时，给予全面的一般护理、心理护理、用药护理等，加强药物不良反应的监测，做好出院指导。结果本

期刊

新活素顽固性心力衰竭护理Lyophilized recombinant human brain natriuretic Peptide Intractab

反垃圾邮件技术探讨

本文从分析垃圾邮件的起因和特点出发,对当前反垃圾邮件的主流技术进行了详细的分析,并对各种技术的优缺点进行了比较.

期刊

垃圾邮件技术探讨SpamTechnologyExploration

对现代陶艺教学的思考

现代陶艺作为一种纯艺术形式出现,比雕塑、绘画等艺术形式要晚得多。在我国,现代陶艺自20世纪80年代以来,发展了近20年。长期以来,中国的艺术家们对现代陶艺语言进行了种种新

期刊