【摘 要】
:
图像阴影去除是图像预处理中必不可少的一步,可以提高计算机视觉和图形任务的性能,但阴影去除效果往往受到场景、光照条件、物体表面反射率的多样性等因素影响,因此如何克服特征提取时面临的诸多困难,实现鲁棒图像阴影去除仍然值得深入研究。该文在生成对抗网络算法基础上,融合敏感参数、谱归一化、自注意力机制等多种结构,从特征提取、模型优化和准确度提升等几方面,提出以下三种改进算法:首先,针对堆叠条件生成对抗网络在
论文部分内容阅读
图像阴影去除是图像预处理中必不可少的一步,可以提高计算机视觉和图形任务的性能,但阴影去除效果往往受到场景、光照条件、物体表面反射率的多样性等因素影响,因此如何克服特征提取时面临的诸多困难,实现鲁棒图像阴影去除仍然值得深入研究。该文在生成对抗网络算法基础上,融合敏感参数、谱归一化、自注意力机制等多种结构,从特征提取、模型优化和准确度提升等几方面,提出以下三种改进算法:首先,针对堆叠条件生成对抗网络在图像阴影去除过程中网络不灵活的问题,提出敏感参数堆叠条件生成对抗网络图像阴影去除算法。首先以阴影图像作为生成器(generator)G1的输入,提取图像中阴影区域、非阴影区域、阴影非阴影边界特征,生成阴影掩膜(shadow mask)。然后将阴影图像和阴影掩膜结合作为生成器G2的输入,实现图像的阴影去除,两个鉴别器D1、D2分别对两个生成器G1、G2的训练过程进行监督。其次,针对循环一致性生成对抗网络在图像阴影去除中网络模型不稳定的问题,提出谱归一化循环一致生成对抗网络的图像阴影去除算法。使用循环一致性网络结合谱归一化,先从阴影图像学习,输入阴影图像,通过生成器G1生成无阴影图像,在阴影掩膜Ml引导下,通过生成器G2将G1生成的无阴影图像输出为阴影图像;再从无阴影图像学习,输入无阴影图像,在阴影掩膜Mr引导下,通过生成器G2生成阴影图像,通过生成器G1将G2生成的阴影图像输出为无阴影图像。同时,采用结合谱归一化的鉴别器D1、D2分别对以上两个过程进行监督。最后,针对生成对抗网络不能更好提取图像中包含的语义信息与像素之间联系,提出注意力生成对抗网络的阴影去除算法。利用对抗性训练建立了一个专注生成网络(an attentive generative network)。在生成器网络中加入注意力机制,注意力机制通过训练学习图像中阴影区域、非阴影区域和阴影非阴影边界,生成注意力图,生成器根据阴影图像和注意力图生成无阴影图像。鉴别器对此过程进行监督,鉴别图像真假。
其他文献
本文以推广的Jacobson方法讨论了SSeS结的Josephson效应,并在小电流假设下,导出了该结的电流密度与位相之间的关系。 首先,介绍了结的各种类型及不同的研究方法。前人已经对SIS结、SNS结、SINS结、SINIS结、SIS1IS结、SNS1NS结等超导结进行了研究,并且在许多领域中获得了及其重要的应用。在Josephson效应的理论研究中,大体上有微观和宏观两种方法,本文采
随着居民生活节奏的加快、购物需求的增加,电商购物平台所提供的足不出户的购物方式,已经演变为青年、中年、中老年消费者的首选,而且这种购物模式的持续发展,既在不断优化电商平台的销售及管理,同时出暴露出电商平台销售的诚信度或各供应环节的衔接问题。本研究以电商平台的水果销售及管理为例,对电商平台销售的优势与问题进行研究,寻求进一步的电商平台水果销售及管理的完善策略。
互联网技术的不断普及,给人们带来了便利的同时也带来了挑战。由于网络安全事件的频繁发生,急需构建高效的流量异常检测模型并将其应用到网络安全领域中解决网络入侵问题。网络流量数据的样本不仅种类繁杂和数据量庞大,而且存在数据不平衡和特征维度高的问题。为了解决上述问题,论文的工作如下。首先,本文采用Boderline-SMOTE少数类数据合成方法,解决网络流量数据集中存在的数据不平衡问题。在网络流量数据中,
本文共2章,首先回顾了无穷矩阵变换的研究历史和现状,然后主要在Banach空间上,对一类非线性映射矩阵的求和法进行了若干研究,得到了有关矩阵变换定理的新结果:给出了Banach空间上一类无穷矩阵变换的刻划;对一个包含所有线性算子和一类非线性算子在内的映射类给出了矩阵族(c0(X),l∞(I,Y))的结论。 这些结果丰富了无穷矩阵变换的研究成果,对我们常接触的Banach空间的研究也具有重要意
本文主要讨论等度连续原理、一致有界原理及Banach-Steinhaus定理等基本原理的最新推广形式,刻划这些新结果在Banach空间上的新特征。本文共分三章,主要内容如下:在第一章绪论中说明了推广一致有界原理的意义;回顾了已知一致有界原理一百多年来的发展及人们在此方面所做的工作。在第二章中主要介绍了一些预备知识,其中包括:解剖算子、吸收算子、等度连续的定义并举了一些相关的例子。第三章讨论了等度连
优化增材制造(3D打印)两相钛合金(α+β)的结构和性能,在科学和工程领域具有重要意义。TC4和TC11合金是国标命名的两种钛合金牌号,在α+β两相钛合金中具有巨大应用价值和广泛应用领域。当脉冲电流经过金属材料时,在材料内产生焦耳热和电子风力,引起再结晶、相变、非晶晶化等现象,从而实现晶粒细化、电致塑性、损伤修复和性能提升。本文结合电脉冲(EPT)工艺特点和增材制造材料存在的问题,对选区激光熔化T
合成孔径雷达(Synthetic Aperture Radar,SAR)图像中舰船检测是目前海上应用中最重要的一部分,在民用和军事领域有着重要意义。SAR舰船图像中不同目标尺度跨度大以及传统检测方法对小目标不敏感是多尺度检测方法成为主流研究方向的两个原因。近年来,基于卷积神经网络(Convolutional Neural Network,CNN)的目标检测在光学领域取得了显著成功,基于CNN的舰船
在认知无线电系统中,宽带频谱感知技术发挥着重要的作用,与之相关的各类方法层出不穷。宽带信号携带了丰富的时域信息,实际应用中在频域往往具有稀疏性。如何有效地提取宽带信号的时频特征仍是频谱重建与感知的难点。为提高宽带频谱感知的性能,该文采用互质采样方法与深度学习思想结合的方式进行研究,研究内容包括以下三个方面:首先,为重建宽带频谱,降低构建宽带频谱感知模型的难度,设计了基于复数卷积的深度迭代网络。以交
随着生活水平的不断提高,以及人口老龄化趋势的日益明显,服务型移动机器人的需求逐渐增加。然而传统的移动机器人同步定位与地图构建(SLAM)技术无法向机器人提供人机交互、路径规划等任务所需的场景高级语义信息。此外,大多数SLAM算法将静态场景作为基本假设,容易受到动态目标的干扰。针对现有视觉SLAM技术的局限性,本文将深度学习与传统SLAM结合起来,构建了一个针对室内环境的鲁棒语义SLAM系统。在动态