论文部分内容阅读
随着计算机技术的高速发展,提取服饰图像中的纹样图案,进行处理和数字化存储对传统纹样的保护和研究具有重大意义。因此本文利用目前性能显著的深度学习技术,从传统服饰图像的特征提取和语义分割模块两方面进行分析,对现有的语义分割模型进行改进,构建基于注意力机制的监督语义分割模型,实现了对传统纹样的语义分割,最后基于提出的模型设计并开发了传统服饰图像语义分割系统。本文的主要工作和创新点包括:(1)构建传统服饰数据集。首先根据图像数字化采集元数据标准,通过扫描仪扫描和照相机等采集设备对传统服饰图像进行数字化采集,并对采集的数据集进行相关预处理,然后按照语义分割任务的要求对采集的图像进行像素级别的标注,最后按照7:3的比例划分为训练集和测试集,为后续实验提供数据支持。(2)构建基于全局上下文学习的语义分割模型。针对传统服饰图像中纹样易混淆、小目标易丢失、纹理独特带来的边缘细节问题,本文分析自注意力机制在获取长距离上下文依赖的优势,通过加入期望最大化注意力模块作为模型的语义分割模块,提出了一种基于全局上下文学习的语义分割模型,并利用残差的思想对期望最大化注意力机制迭代的过程进行优化,降低迭代中出现的细节损失。实验证明了改进的期望最大化注意力模块可以更好的建立特征图中位置间的联系,有效地改善了传统纹样的分割质量。(3)构建基于显著性融合学习的语义分割模型。针对传统服饰纹理细腻、颜色繁杂和目标尺度变化大的特点,本文研究了 ELASTIC结构的动态缩放策略和卷积注意力模块学习显著性特征的特点,通过在特征提取阶段引入一组平行的的卷积注意力模块,并结合改进的期望最大化注意力模块,提出了一种基于显著性融合学习的语义分割模型。实验证明卷积注意力模块不仅有效地抑制无效特征,使物体区域的特征更加显著,而且提升了改进的期望最大化注意力模块对传统纹样图案分割的能力。(4)设计并实现了传统服饰纹样分割系统。基于提出的语义分割模型,首先系统能够对传统纹样图案进行高质量的分割,同时还提供了重新训练的扩展功能,支持自定义模型训练,最后纹样素材库模块为纹样素材库的扩充提供技术支持。