面向计算机视觉的生成对抗网络研究与应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:yingzhao1121
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能和深度学习的快速发展,面向计算机视觉的生成模型研究获得了广泛的应用。其中,生成对抗网络具有最深远的影响。相较于其他传统的生成模型,生成对抗网络中生成器与鉴别器的对抗训练可以在显著提升生成样本生成质量的同时避免传统生成模型近似或者变分的推导过程。另一方面,由于生成器不直接参与数据分布的学习,这使得生成对抗网络对与数据分布相关的先验知识并不敏感,从而可以更好地生成与数据分布相似但又不完全相同的新样本。尽管生成对抗网络具有多个优点且已经在不同的任务中都取得了成功,但其依然存在两个固有缺陷:训练动态不稳定和模式崩溃。本文对生成对抗网络的相关研究和发展现状进行了梳理,根据流形理论和最优传输理论分析了这两种固有缺陷出现的原因,并从不同的角度提出了两种解决方案。在此基础上,进一步扩展了生成对抗网络在半监督学习和强化学习中的应用,为生成对抗网络在医学领域中的应用提供了新的思路。在该过程中,利用理论分析和大规模实验充分验证了提出的方法与应用的有效性。本文工作的具体概述如下:(1)针对生成对抗网络的两种固有缺陷,本文提出了一种基于具有不同损失函数的多鉴别器集成的生成对抗网络框架CES-GAN。通过同时对多个具有不同损失函数的鉴别器进行集成训练,利用不同损失函数偏好不同数据模式的特点尽可能捕获数据空间中可被观察的数据模式并稳定生成对抗网络的训练动态。同时,针对不同性能鉴别器集成可能出现木桶效应的问题,本文还提出了一种梯度选择机制,只使用能够有效降低生成分布和数据分布之间距离的梯度来更新生成器的权重,从而避免性能较低的鉴别器带来的负面影响。最后,本文提供了理论分析以证明方法的可靠性,并在不同规模的多个数据集上验证了该方法的有效性。(2)针对生成对抗网络训练动态不稳定的问题,本文提出了一种基于隐层表征的生成对抗网络快速构建方法。通过解耦生成对抗网络的生成过程将其分为两个独立的生成过程以分别生成经验隐层表征和最终结果,从而稳定生成对抗网络的训练动态并捕获更多的数据模式。在第二个阶段中,使用经验隐层表征替换白噪声作为生成器的输入。考虑到隐层表征是数据分布在神经网络隐空间中的低维映射,具有数据分布的先验知识,这意味着二者的映射函数将更加连续和平滑。因此,该方法可以有效稳定生成对抗网络的训练动态。最后,本文通过理论分析证明了该方法可以稳定生成对抗网络的训练动态并降低对抗训练的难度。多个数据集上的大规模实验证明了该方法的有效性。(3)针对监督学习中深度学习分类网络一般性特征和特异性特征不平衡导致的过拟合问题,本文提出了一种基于特征均衡的半监督训练方法。将分类网络顶端的卷积层视为生成器并将其输出作为伪样本,真实样本经过矩阵变换得到的投影作为真样本,引入一个无监督鉴别器基于对抗损失来尝试区分这两种样本,进而约束模型更多的学习一般性特征而非特异性特征。理论分析和大规模实验证明了该方法的可靠性和有效性。(4)针对新冠肺炎与其他肺炎放射学特征过于相似的问题,本文提出了一种基于生成对抗网络的半监督学习检测模型以识别不同类型肺炎医学影像之间的细微差别。同时,针对放射学特征和临床指标不平衡导致的归纳偏置问题,本文提出了一种基于生成对抗网络的强化学习预测框架,以结合放射学特征和临床指标预测新冠肺炎患者病情进展。本文还构造了一个包含超过十万张CT影像的新冠肺炎胸部扫描图像数据集,并基于此进行了大规模的验证。除此之外,外部验证集的结果证明了提出方法的有效性和泛化能力。本文提出的方法可以显著稳定生成对抗网络的训练动态并捕获更多的数据模式。同时,在半监督学习和强化学习上的应用结果表明生成对抗网络具有很高的潜在应用价值。
其他文献
钙钛矿太阳能电池(PSCs)以其高光电转换效率(PCE)、高缺陷耐受性和易于制备等优点受到研究者广泛关注。PSCs的电子传输层、钙钛矿层和空穴传输层主要通过逐层方式沉积,层间界面不可避免地成为缺陷富集地,极大地影响着PSCs效率、稳定性和迟滞等性质。因此,开展PSCs相关界面的研究对于促进其性能改善和器件应用具有重要的科学意义和价值。基于此,本论文对PSCs相关界面进行了详细研究,具体包括电子传输
电磁波吸收材料(吸波材料)可以有效降低武器装备的雷达信号特征,提高其战场生存能力,且在治理电子设备间的电磁干扰和防范电磁波对人体健康的危害等民用领域也有广泛应用。与传统的磁性吸波材料相比,碳基吸波材料因为具有密度低,耐氧化、耐腐蚀性能好的优势而备受关注。然而,目前的研究主要关注各种微纳结构的合成和调控。为定量地、系统性地理解碳基吸波材料的电磁性能,本文从计算和实验两方面进行研究,一方面利用材料基因
随着化石能源的不断消耗,利用电化学储能装置实现可再生能源的存储非常重要。水系锌离子电池具有高安全性和经济性的特点,使其在电网或微型电网等固定存储设备以及家用电池等其他不太关心重量比容量的应用上具有广阔的前景。钒氧化物作为一种重要的水系锌离子电池正极材料,具有储量丰富、比容量高等优势。然而,其在循环过程中也存在许多问题,如锌离子与材料主晶格之间具有强烈相互作用,使得电池表现出较差的循环稳定性及倍率性
作为产生强流高电荷态离子束的最有效装置之一,电子回旋共振(Electron Cyclotron Resonance,ECR)离子源因其优异的性能受到国际上加速器领域的重视。然而,对ECR离子源物理机制的研究远远落后于其技术的发展。由于ECR等离子体的复杂性与多变性,仅仅依靠实验研究很难理解清楚其中的全部物理机制,因此数值模拟逐渐成为了研究ECR离子源的重要辅助手段。高电荷态离子的产生是ECR离子源
近年来,随着可再生能源发电技术的快速发展,可再生能源在电力系统中占比不断提升,其中又以水电和风电占比最高。大规模风电和水电并网使得电力系统运行特征发生了显著改变。特别的,系统中水电出力季节性强,而风电出力存在随机性,两者出力的波动变化、以及负荷的不确定波动和输电通道上自然灾害频发,使得系统的输送功率、运行方式和安全稳定特性复杂多变,呈现出高维、时变、非线性特性,暂态稳定问题突出,电网抵御功率扰动能
阵列雷达大致经历机械扫描雷达、相控阵雷达和多输入多输出(Multiple-Input Multiple-Output,MIMO)雷达等发展阶段,通过发射端和接收端的波束形成,扫描空间角度域中的目标。其广泛应用在军事中的预警、探测和火控等场景中,以及民事中的气象、遥感和载具防撞等场景中。其中的MIMO雷达具有角度-时间域波形分集特性,因而比相控阵雷达具有更多的处理自由度,能够获得更优良的目标检测、参
随着现代通信等电子信息技术的蓬勃发展,电子系统对高输入带宽、高分辨率、高采样率模数转换器的需求愈来愈大。时间交织逐次逼近模数转换器(Time-Interleaved Successive Approximation Register Analog-to-Digital Converter,TI-SAR ADC)结合了SAR ADC易于用数字工艺实现和时间交织(TI)架构能以多通道数交织达到倍增AD
微纳塑料(micro-/nano-plastics,MNPs)被认为是在土壤中普遍存在的一类新型污染物,它们能够影响污染物在环境中的行为,并对生物体产生潜在的不利影响。到目前为止,对于不同浓度、粒径的MNPs对有机污染物在陆地无脊椎动物中的累积影响机制仍不清楚。本研究探讨了土壤中不同浓度(10和100 mg/kg)的聚苯乙烯(polystyrene,PS)微塑料(microplastics,MPs
近年来,随着无线通信领域相关技术的快速更新,电子通信系统也开始不断地向多频化、小型化和集成化的方向发展。由于射频集成电路和微波电路结构越来越趋向复杂化多层化,跨尺度封装与设计问题也逐渐被凸显出来。其中,针对集成电路中互连线结构的设计与高效仿真也成为了一个研究的重要方向。由于互连结构通常需要工作在宽频带内,在低频域中可以通过准静态法来进行分析。然而,随着频率升高至微波频段,电场与磁场出现耦合,准静态
电磁波作为现代信息传递的载体,在通信,成像,以及医疗等方面都具有重要作用。可见近红外光由于其高频率以及强抗干扰力等特点,成为当前光控研究领域的热点之一。传统的光学元件主要是通过传播过程中相位的累积实现电磁波的操控,例如,利用曲面透明材料制成的光学透镜实现光束聚焦、基于双折射材料实现偏振转换等,但是,其通常具有体积庞大、结构厚重等缺点,难以实现集成化和小型化的器件发展需求。而基于亚波长纳米结构的光学