基于深度学习的图像生成技术研究与应用

来源 :电子科技大学 | 被引量 : 14次 | 上传用户:xjfox1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像生成模型是用于对图像进行概率建模的概率模型,而深度神经网络可以看成是一个非常复杂的、拟合能力非常强的非线性函数,可以用于搭建生成模型来估计概率密度函数的参数。图像生成模型可以用于更多不同图片样本的生成,可以用于图像信息的恢复,也可以用于不同模态的图片或者图片与文字、语音等之间的转换,还可以用于预测未来,例如可以根据视频中过去帧和当前帧预测来未来帧。本文首先介绍了生成模型在有监督学习和无监督学习中的定义,分析了为什么要学习生成模型的几点原因,并介绍了生成模型在国内外取得的发展,以及将目前的深度生成模型做了一个简单的分类。然后本文介绍了目前深度学习领域中常用的三种生成模型:深度置信网络、变分自编码器和生成式对抗网络,及其改进和变种。我们提出的方法就是基于其中的变分自编码器。接着为了学习可解释的表达来增强图片生成的可控性,本文提出了一个多任务变分自编码器,对人脸图片和人脸轮廓进行联合概率建模,将人脸图片中的位置信息分解出来,并将人脸视觉属性视为人脸图片的一部分隐藏变化,利用二值属性标注使一部分隐藏变量来捕捉这部分视觉属性信息,这样便可以学习到关于人脸图片的分解的、可解释的隐藏表达。利用这个可解释的隐藏表达可以控制生成图片的一些可解释的成分。也可以对输入图片进行编辑,改变输入图片的某些视觉特性。最后本文对人脸照片在简笔画的条件下进行条件概率建模,并将人脸视觉属性视为一部分隐藏变量,控制从人脸简笔画到人脸照片的合成。实验证明,我们提出的模型可以生成更加自然、更加真实的人脸照片。输入一张简笔画,可以通过调节属性变量,生成具有不同视觉属性的人脸照片。将人脸视为人脸照片的内容,将背景、光照等与人脸无关的因素视为人脸照片的风格,给定一张风格照片,我们的模型可以从任意简笔画合成具有目标风格的照片。
其他文献
目的探讨新活素治疗顽固性心力衰竭的护理方法。方法遵医嘱使用新活索治疗心衰的同时,给予全面的一般护理、心理护理、用药护理等,加强药物不良反应的监测,做好出院指导。结果本
本文从分析垃圾邮件的起因和特点出发,对当前反垃圾邮件的主流技术进行了详细的分析,并对各种技术的优缺点进行了比较.
现代陶艺作为一种纯艺术形式出现,比雕塑、绘画等艺术形式要晚得多。在我国,现代陶艺自20世纪80年代以来,发展了近20年。长期以来,中国的艺术家们对现代陶艺语言进行了种种新
用虚拟机实现在不同网络之间的互连及应用服务为学习网络技术的学生提供了一种新的实训平台。通过虚拟机,实训者可以随时切换扮演各种管理角色,全方位地掌握实现网络的各个技
对Visual FoxPro多媒体编程中Multimedia MCI控件和若干API函数的使用方法进行了讨论,给出了应用示例。Multimedia MCI控件为多媒体文件的播放提供了一个标准界面。API函数中
本文应用ICMP协议技术和数据库管理技术相结合的方法,探讨如何以最快的方式监测整个校园网络设备的工作状态.以提高网络的管理效率。
随着我国经济的发展和提高,对传统中的工程造价审计方式已经落后于当前的审计模式,工程造价审计工作要实现现代化的发展,就要采取信息化工程造价审计模式。而目前的工程造价
面向对象的编程思想,毫无疑问已经是现在的主流设计思想,无论在桌面式应用还是在基于网络的web应用,都在广泛使用这种思想。Java作为面向对象语言的重要代言人,充分展示了这种思