【摘 要】
:
近年来,在计算机视觉领域,深度学习推动了人脸识别、自动驾驶等很多技术的快速发展。但在实际应用中,深度学习模型需要大量的图像样本来进行训练,而由于涉及到隐私、成本等问题,图像训练样本的获取往往非常困难。生成对抗网络(Generative Adversarial Nets,GAN)能够生成大量逼真的图像对训练样本进行补充,为解决图像训练样本难以获取的问题做出了贡献。作为GAN的变体,带有一致惩罚项的瓦
论文部分内容阅读
近年来,在计算机视觉领域,深度学习推动了人脸识别、自动驾驶等很多技术的快速发展。但在实际应用中,深度学习模型需要大量的图像样本来进行训练,而由于涉及到隐私、成本等问题,图像训练样本的获取往往非常困难。生成对抗网络(Generative Adversarial Nets,GAN)能够生成大量逼真的图像对训练样本进行补充,为解决图像训练样本难以获取的问题做出了贡献。作为GAN的变体,带有一致惩罚项的瓦瑟斯坦生成对抗网络(Wasserstein GAN with Consistency Term,CT-GAN)提升了模型在训练时的稳定性。但CT-GAN在训练时仍然存在初期波动、难以快速收敛等不稳定问题。本文为了进一步提高生成图像的质量,对CT-GAN遗留的不稳定问题进行了分析,并将导致其不稳定的原因归纳为两个方面:(1)鉴别器处理1-Lipschitz约束的方法不当;(2)针对生成器的约束缺乏。针对原因一,本文基于梯度惩罚方法构造了一个非对称双边惩罚项(Asymmetric Two-sided Penalty Term)来改进CT-GAN鉴别器的目标函数。在此基础上本文建立了WGAN-AP模型。该模型针对特定区域内不同的梯度范数采用不同的惩罚方式且关注到了生成样本边缘区域,实现了更加松弛且范围更广的约束。通过在Toys、MNIST、CIFAR-10和Image Net数据集上进行实验,本文验证了WGAN-AP模型前期波动更小,能更快地收敛到稳定状态,且提高了生成图片的清晰度和多样性。针对原因二,本文基于正则化技术对WGAN-AP模型在监督学习和非监督学习模式下实施了不同的优化方案。在监督学习模式下,本文对生成器网络中Linear、Residual Block和Conv层的权值矩阵进行了谱归一化,建立了WGAN-AP+SN模型。而在非监督学习模式下,本文在生成器的参数迭代过程中加入了以鉴别器梯度为基础的约束项,建立了WGAN-AP+GC模型。通过在MNIST、CIFAR-10、Image Net数据集上进行实验,本文验证了该优化方案可以使得WGAN-AP模型在监督学习和非监督学习模式下都更加稳定且生成更高质量的图像样本。综上所述,本文为了缓解深度学习模型图像训练样本不足的压力,对图像生成模型CT-GAN进行了研究。最终,本文基于梯度惩罚和正则化技术提升了CTGAN的训练稳定性,提高了模型生成图像的质量。
其他文献
在电动汽车的行驶过程中,特别是电量较低时,如果电池输出功率较大,将很容易引发过放电并进而导致电池内部产生不可逆的损伤。因此,为确保电动汽车的运行安全和可靠性,现有技术通常利用电池管理系统(BMS)对电池的最大功率输出能力(SoP)进行估计,再通过整车控制系统控制电机的扭矩以保证电池的输出功率不超过其SoP。这种“先估计最大能力、再进行闭环控制”的方式计算复杂度低且实施简单,但缺乏对未来负载的考量,
本文对基于Yolov3的目标检测识别和视觉跟踪算法进行研究,本文主要开展了如下工作:1.本文对目标检测展开研究,本文提出了引入通道剪枝的单输出层Yolov3改进目标检测算法,为缩减算法参数量和计算量,该算法使用通道剪枝操作精简网络层次,在不影响准确性的前提下可以获得整体宽度更小的网络,同时为了防止强制性分层预测该算法将原本Yolov3算法的多输出结构改为单输出层结构。2.本文对目标跟踪展开研究,本
随着工业的快速发展,我国环境污染状况日益严重。在污染环境的修复进程中,土壤污染是最为棘手的问题。不同于有机污染物可以被微生物降解,土壤中的重金属只能通过人为的提取(如淋洗、电动修复)或者向土壤中投加稳定剂,使毒性大、迁移能力强的重金属转化成毒性小或无毒、迁移能力弱的形态。其中,铬污染的土壤需要特别注意,不仅因为Cr(Ⅵ)致癌性和高毒性,而且还因为其不同的性质(如,不同p H值下的价态变化、阴离子形
随着科学技术与经济的快速崛起,数字化、图示化与抽象化的建筑空间占据了我们的生活,城市化进程快速推进的过程夹杂着快餐式文化,这使得我们所处的空间缺少了底蕴与人性,过度重视觉效果的视网膜建筑,废弃了其他感知器官进而疏远了我们的身体,忽略了我们内心的感知,使我们的精神、记忆、情感无处安放。自上而下形成的现代化空间,大多由建筑师个人的想法所摆布,只看重形式与功能则必然留下对建筑空间的身心体验与精神寄托的空
“智能无人零售车”是自动驾驶技术与网络在线支付技术的融合,对于新零售具有重要的理论和实践意义。智能无人零售车使人们的生活更加便捷与丰富,也是消费市场出现的前所未有的新奇购买方式。无人车技术属于智能自动驾驶车领域,也被称为轮式智能机器人。无人车技术主要依托于车内计算机系统,使其能根据指令移动到某个特定的地点。交通方式正在步入智能化自动驾驶的时代,随着车联网技术的铺开,百度作为全国自动驾驶的领军企业,
商业的石墨/炭负极的低比容量严重限制了锂离子电池的进一步发展,而硅由于其4200 m Ah g-1的高理论比容量、较高的丰度及环境友好等优势被认为是最具有前景的下一代锂离子电池负极材料。然而在合金化过程中,高容量也伴随着巨大的体积效应和内应力,使得电极结构不稳定,硅颗粒破碎及固体电解质界面的反复再生会导致容量的急剧衰减。另外,硅具有半导体特性,较差的电子、离子传输速度也制约了其作为负极材料的应用。
改革开放以来,新疆的经济快速发展,人均地区生产总值由1978年的313元提升到2017年44941元,番了整整7番,人民生活水平不断改善,生活幸福指数显著提高。但是需要注意的是,作为新疆首府的乌鲁木齐在2017年的生产总值为2730亿元,同年南疆四地州中的克孜勒苏柯尔克孜自治州生产总值为118亿元,两者生产总值相差近27倍。新疆作为“丝绸之路经济带”的核心区,是推动我国区域经济协调发展的重要组成部
随着智能电网战略的发展和推进,电力系统和信息系统之间的交互愈发紧密。智能电网被视为一种典型的信息物理系统即电力信息物理系统(Cyber Physical Power Systems,CPPS),其信息-物理交互作用于电能的产生、传输和分配等过程。近几年发生的若干起蓄意攻击电力系统的事故表明,电力系统融合信息系统会带来新的脆弱性因素。而以往的CPPS研究分析仅从单一系统出发进行分析,与实际情况存在偏
石墨作为当下最普遍的锂离子电池(LIBs)负极材料,在LIBs商业化应用中取得了巨大的成功。然而,石墨负极材料的储锂容量(372mAh·g-1)较低,难以满足“信息社会”高速发展对于高性能储能器件的要求。因此,开发高容量的新型LIBs负极材料具有重要意义。同时,作为高容量的新型负极材料还应满足储量丰富、开发成本低廉以及利用率高等要求。非金属材料中的硅、锗、磷以及金属类的锡、锑等具有较高的理论比容量
药物诱导肝损伤(DILI)是指因药物本身或其代谢产物导致的肝脏损伤,已成为药物撤市和药物研发失败的主要原因之一。DILI是一个复杂的过程,在这个过程中,伴随着各种相关的生物酶和活性物种(活性氧、活性氮、活性硫等),含量的变化。其中,过氧亚硝酰阴离子(ONOO-)在DILI早期阶段显著增加。因此,实现细胞和活体内ONOO-浓度变化的精准检测,对DILI机理研究以及预防具有重要意义。然而,ONOO-具