论文部分内容阅读
羊绒和羊毛纤维的形态学特征,以及其物理和化学性能都较为相似,因此这两种纤维的鉴别一直是一个具有挑战性的命题。长期以来人们研究出许多鉴别方法,但基于显微镜的人工鉴别方法仍然是目前最主要的实用检测方法。人工鉴别方法需要检测人员长时间在显微镜下观察纤维的形态,这种方法不但费时费力、效率低,而且检测结果非常依赖于检测人员的主观经验。多年以来,研究人员一直在寻求一种快速、准确的自动识别羊绒和羊毛纤维的方法,并做了很多有益的尝试。最近计算机视觉和机器学习技术有了长足的发展,特别是深度学习模型在图像分类和目标检测等领域有非常好的应用效果。本文主要使用计算机视觉技术,对羊绒/羊毛纤维的识别方法和纤维图像的视觉特征表达进行了深入研究,本文的主要研究内容和贡献如下:(1)根据人工鉴别羊绒和羊毛的经验,尝试使用了多种显微镜采集纤维图像,比较和分析了纤维图像的质量、效率和成本等因素,选定了适合快速采集纤维图像的设备,并规定成像标准。拍摄5万余幅显微镜图像,建立了一个羊绒和羊毛纤维图像数据集,为深入研究基于视觉形态的羊绒和羊毛的识别问题提供样本支持。(2)提出一种基于投影曲线的纤维识别方法,首先将羊绒/羊毛纤维图像转化为投影曲线,然后使用离散小波变换、递归定量分析、曲线的直接几何描述等3种不同方法从投影曲线中提取特征,再将提取的特征输入到神经网络、支持向量机、核岭回归等几种分类器中对纤维的进行识别分类。通过比较几种方法的测试结果,发现递归定量分析和支持向量机组合分类效果最好,识别率达到90.8%。我们还研究了递归定量分析方法中的重要参数——阈值距离的取值,发现当其值为5时识别率最高。(3)研究了基于空间金字塔匹配的词袋模型在羊绒和羊毛纤维识别中的应用。词袋模型是一个经典的图像分类模型,本文首先对羊绒/羊毛两种纤维图像进行预处理,然后使用SIFT描述子从纤维图像中提取特征,使用这些特征建立视觉词典,并将每幅图像描述为一组视觉单词。为了增强视觉单词对图像空间信息表达能力,采用空间金字塔匹配方法将每幅图像转化为一组向量,最后这些将向量输入到分类器进行有监督学习和分类,识别率超过93%。本文还讨论了词袋模型的两个关键参数——视觉词典大小和分辨率水平的设置,在权衡模型的辨别性能和泛化性能后,选择视觉词典大小为600,分辨率水平为2。比较了纤维图像预处理前后的识别率,发现图像背景剔除有利于提升模型的性能。最后还使用不同混合比的纤维图像来评估模型的稳定性,结果表明每组样本中的识别率都超过90%。(4)使用局部二进制模式(Local Binary Pattern,LBP)提取纤维表面纹理特征,并评估了不同LBP方法在纤维识别中的效果。将纤维表面的鳞片模式看做是一种纹理特征,使用纹理特征描述子LBP来提取纤维图像中的特征,将特征转化为LBP直方图向量,并使用分类器对这些向量进行分类。实验中比较了几种不同的LBP特征提取方法,发现旋转不变共生LBP和旋转不变共生邻近LBP能较好地描述纤维图像特征。其中,前者的描述能力更强一些,而后者的特征维度更低。在扫描电子显微镜图像数据集上进行测试,模型识别率高达96%左右;在光学显微镜图像数据集上,模型的识别率达到90%以上。(5)参照VGG-16模型建立了一个卷积神经网络模型——Fiber-Net用于羊绒和羊毛纤维识别。使用数据集中5种不同的羊绒和羊毛纤维图像对模型进行训练,识别率为92.74%。其中蒙古紫绒的识别率最高达到99.7%,其次是土种毛,其识别率达到96.7%,而国产白绒相对识别率较低,达到86.4%。国产青绒和蒙古青绒的识别率分别是90.8%和89.8%。实验结果表明,卷积神经网络可以较好地解决多分类纤维识别问题。与本文提出其他几种方法相比,卷积神经网络识别效果最好。(6)以VGG-16模型为例,研究了迁移学习在纤维识别上的应用。实验中将ImageNet数据集上预训练的图像特征迁移到纤维识别任务上,通过逐层加载预训练模型参数,发现底层特征迁移学习的效果较好,而高层特征迁移会明显降低模型的识别率。实验中在不同大小数据集上评估了迁移学习的效果,结果表明当数据集较小时,通过迁移学习可以提高模型的性能。