【摘 要】
:
风格迁移算法是当前计算机视觉领域的热点研究方向之一。当下神经风格迁移的技术路线可分为:基于图像迭代的风格迁移和基于模型迭代的风格迁移。其中,基于图像迭代的风格迁移算法,通过不断迭代噪声图像的像素来生成风格化图像,具有合成图像质量高、可控性好、易于调参、无需训练数据的优点。而基于模型迭代的风格迁移技术,借助生成对抗网络(GAN)强大的生成能力,通过预训练生成模型来实现快速风格化。该方法具有计算速度快
论文部分内容阅读
风格迁移算法是当前计算机视觉领域的热点研究方向之一。当下神经风格迁移的技术路线可分为:基于图像迭代的风格迁移和基于模型迭代的风格迁移。其中,基于图像迭代的风格迁移算法,通过不断迭代噪声图像的像素来生成风格化图像,具有合成图像质量高、可控性好、易于调参、无需训练数据的优点。而基于模型迭代的风格迁移技术,借助生成对抗网络(GAN)强大的生成能力,通过预训练生成模型来实现快速风格化。该方法具有计算速度快、可用于即时应用部署的优点。但是,上述两种技术方案都不是风格迁移的完美解决方案:首先,基于图像迭代的迁移方法虽然具有合成图像质量高、无需训练数据的优点。但是其缺点在于:计算时间长、不利于即时应用部署、感知损失的计算对预训练模型依赖大。第二种模型迭代的风格迁移:训练对数据依赖度高、数据需求量大、计算量大、训练时间长、对硬件要求高;且生成对抗网络模型复杂,存在训练不稳定、模式崩溃的问题,使得模型训练难度大。本文提出了一种神经风格迁移方法,综合了以上两种技术路线的优势,利用单图像生成模型(SinGAN)与自适应归一化(AdaIN)方法,设计了一个可以较好提升图像风格化质量,同时,降低图像训练复杂度、加速训练时间的单图像风格迁移模型。首先,本文对原有的单图像生成模型(SinGAN)进行了改进,该改进的主要目的是提高SinGAN模型的生成能力,解决原模型生成图像中的噪点过多、结构扭曲、细节失真等问题。通过引入SSIM损失函数,重新构建SinGAN模型的损失函数并重新选择激活函数,改善了生成图像噪点过多的问题,使生成图像更加平滑。通过引入了多阶段并行训练方法解决了生成图像结构扭曲的问题,并通过级差缩小学习率的方法克服了并行训练方法带来的过拟合问题,稳定了SinGAN模型的训练。通过渐进式增长策略与训练阶段数的实验,寻找到最佳的增长策略与阶段数,增强生成图像的细节。其次,改进了AdaIN风格迁移算法。通过跨连接层设计增强对图像的风格化效果。并通过缩放参数实验、寻找到较好的缩放结构,改善了生成图像的清晰度与亮度细节。之后,构建了基于单图像生成算法的风格迁移模型。该模型的构建分为两步完成,第一步通过卷积网络与自适应归一化方法构建基础迁移网络;第二步利用改进的SinGAN模型构建了图像修正网络。通过基础网络与修正网络的合同协助,完成图像的风格迁移。最后,通过与Gatys模型、AdaIN风格迁移模型的对比实验,验证了模型的可行性。并验证了模型在提升图像风格化质量、降低训练复杂度、加速生成图像时间等方面的提升。并通过设计实现在线风格迁移系统,完成了算法的应用部署。
其他文献
股票长期以来都是万千民众喜好的理财方式,由于我国股市有效性不强且股票价格变动存在一定的运动规律,因此被认为其股票走势是可以预测的,于是各种量化方法被应用于股票预测中,为股民进行股票交易提供了参考依据。近些年来机器学习与深度学习算法的蓬勃发展给股票预测量化手段提供了新的思路,其中LSTM神经网络算法能够有效处理长短期金融时间序列数据,且算法十分关注模型的准确性;而XGBoost算法在分类、回归、预测
随着智能手机的发展,网购逐渐成为了人们日常购物的主要方式,充分利用用户在平台的行为反馈信息,挖掘信息中的价值是近年来大数据领域的研究趋势。许多学者通过用户基本特征信息建立机器学习模型,探究其行为是否发生或预测再次发生的回归时间,还有研究者通过海量数据建立用户画像,运用推荐算法提高用户的购买转化率,从而提高平台的收入。而少有学者从时间变化的动态角度去探究用户行为的激励关系,通常认为历史事件的发生会对
在全球经济增速放缓的大背景下,再叠加席卷世界的新冠疫情,中国就业形势十分严峻。而随着互联网浪潮的兴起,中国网民的数量急剧增长,这极大地促进了互联网招聘行业的发展,使用求职类应用软件的求职者也在与日俱增,互联网技术的最大优势在于信息传递的快速性和无限性,人们可以足不出户就了解到远在千里之外的招聘信息。求职类应用软件的招聘信息数量庞大,更多的选择性被赋予了求职者,他们可以认真浏览仔细挑选,直到找到自己
随着经济全球化的发展,中国股票市场也在不断发展,深圳交易所和上海交易所的股票相关制度不断的完善,我国上市公司的数量越来越多,中国股票市场呈现为错综复杂的关系网络。股票市场的本质是一种复杂系统,股票之间相互影响、相互作用,形成了股票市场的生态和价格演化过程。而复杂网络的其在建模真实数据结构时表现出的灵活性和普适性,复杂网络就成为研究股票市场的利器。目前,运用复杂网络的技术方法探索股票网络的物理结构和
近年来,比特币作为一种数字加密货币,受到了媒体、学术界以及监管机构等各方的关注。从2010年比特币第一次交易至今,其价格上涨了100万倍以上,众多学者通过定量和定性分析的方法得出比特币价格存在泡沫的结果。比特币交易市场的有序运行对金融市场的发展具有重要价值,泡沫破裂会对金融市场的发展造成较大影响,因此需要对比特币价格泡沫进行测度和预警。本文基于现有的比特币价格泡沫理论,选取了2013年1月1日至2
随着数字化进程不断推进,大量企业在加速各类流程自动化的过程中逐渐引用数据库、云存储等技术平台,积累了大量客户数据。由于大数据技术逐渐成熟,一些企业开始从客户数据中挖掘有用信息,以指导企业更好地运营。目前,市场竞争日趋激烈,同行业的产品同质化现象日益严重。客户成为企业赢得市场先机的重要资源。在产品同质化背景下,客户占据绝对的主导地位,一旦企业无法满足其需求或者有更优的替代选择,就很容易导致客户的流失
目前,我国经济正处于快速发展阶段,证券市场欣欣向荣,上市公司层出不穷,但相关审查机制和监管法规相对不够完善,导致上市公司财务舞弊行为频发,虽然目前采取的监管措施在一定程度上减少了财务舞弊的发生,但财务舞弊依然是近几年监管部门的心头大患。企业为了谋取自身利益从而通过某些不正当的手段进行财务舞弊不仅影响上市公司自身的发展,让公司时刻面临着停市的风险,还影响公司内外各利益相关者的权益,阻碍了我国资本市场
环境细颗粒物(PM)对健康的影响已经被全球广泛研究了几十年,PM被列为全球导致人口死亡和残疾的第六大危险因素。PM2.5与PM10与各种短期和长期健康不良影响有关,可吸入颗粒物会被人体吸入并积累在人体中,沉积在呼吸道中,并进入肺泡等部位,引发多种疾病,对人体健康造成严重危害,长时间暴露于高浓度的环境细颗粒物中甚至会引起死亡,中国每年因为PM污染导致的过早死亡人数在165万至219万之间。近年来,环
随着社会不断发展,人们对社交需求不断增加,类似商场、广场等公共场所的人流量也在不断增加,这对公共场所行人安全的要求变得越来越高。在公共场所发生突发事件时,由于相关管理人员没办法及时获取突发事件的预警消息,导致无法及时疏散人员,最终造成公共场所人员的生命损伤或者财产损失。针对这种需要长时间监控的情况,传统人工视频监控没办法高效地完成监控预警工作。如今监控视频技术不断更新和应用,使用智能化的视频来侦测
随着日常生活中电子设备和社交媒体的广泛应用,新闻、商品评论等文本类型的数据大量增长,快速提取和分析文本信息的需求显著上升。主题分析可以帮助我们快速确定想要了解内容,自然语言处理中的主题模型能从大量的文档中提取出有意义的词语、能够有效的将多个文档表示为主题,因此研究主题模型是十分必要和有意义的。主题模型是自然语言处理任务中一种典型的无监督任务,缺乏有标注的监督数据。在单语言的情境下,其他任务上表现良