论文部分内容阅读
中国传统服饰被誉为中国国粹和中国服饰之代表,是中华民族乃至人类社会创造的宝贵财富。提取传统服饰图像中具有代表性的纹样基因,有助于挖掘其文化内涵,发现其文化传承机理。本论文以传统服饰图像为研究对象,开展传统服饰图像自动分割算法研究,提取有价值的纹样基因。交互分割算法因其交互方式灵活、精度高、用户交互工作量少而受到广泛关注,深度学习在图像分割领域也取得了突出成果。但在没有逐像素标注的图像数据集时,实现传统服饰图像的自动分割并获得较高精度的分割结果仍是一个亟待解决的问题。与自然图像相比,传统服饰图像上的纹样基因多为小尺寸目标,且样式丰富,就算是同一类别的纹样基因之间样式也有较大差异,在不同材质的布料上相同纹样基因的纹理也会有差别,这些特点增加了传统服饰图像的分割难度。为实现传统服饰图像自动分割任务,本文提出一种基于双层模型的弱监督图像分割算法。该双层模型由目标检测层和分割层两层结构组成,模型先将待分割的纹样基因目标检测出来之后再进行分割,这样可以提高小目标的分割精度。而且如果目标检测器泛化性能较好的话,那么检测器很大可能性可以检测出样式差异较大的同一类纹样基因。在传统服饰图像的分割任务上,与直接训练图像分割模型的方法相比,在检测的基础上再进行分割这种方法的分割效果可能会更好。所提模型的目标检测层使用了本文提出的GRP-DSOD++目标检测框架获得目标的位置坐标和类别信息。分割层基于目标检测层输出的位置信息得到类别未知的分割结果,该结果与类别信息相对应构成具有语义的分割结果。论文的主要创新点与研究内容包括:(1)分析现有图像自动分割算法应用到传统服饰图像上的局限性,为了实现面向传统服饰图像的自动分割,提出了一种融合深度学习和交互分割的双层模型图像分割算法。该算法首先通过基于深度学习的目标检测方法输出目标位置和类别信息,然后将这些信息输入到交互分割方法中实现传统服饰图像自动分割,并且分割结果具有语义信息。(2)对基于深度学习的GRP-DSOD目标检测框架进行改进。将本文提出的dilated-Inception模块(DI模块)应用到目标检测系统中,并在网络底层引入SE block增强对后面层用处大的通道特征,抑制无用的通道特征,在目标损失函数的置信损失中引入权重因子解决正负样本平衡问题,并将原始网络结构里的后两个密集块中的标准卷积改为了膨胀卷积。论文将改进后的目标检测器称为GRP-DSOD++目标检测器。(3)设计并实现了基于双层模型的图像分割系统,该系统在传统服饰图像数据集上验证了算法的有效性,并在公开数据集上进行了实验。