论文部分内容阅读
在工业4.0时代,工业计算机视觉及其相关应用日益获得成功和普及。由于多媒体数据规模的增加和算法的复杂性更加,它在增强计算机视觉算法中起着至关重要的作用。本研究引入了多种模型,其中介绍了最新的Spearman相关分析算法(带Rank的典型相关分析)及其代数扩展和深度学习模型。此外,这其中的大多数模型都受到了迁移学习方法的启发。本模型引入了非线性多维数据集,由于数据的非线性,多维数据及其对应的应用程序面临多个挑战。本文提出的模型通过与问题相关的数据集的分析,提出了针对复杂性问题的非线性优化和降维的解决方案。本研究主要分为以下三个部分:首先介绍了Spearman相关算法的内核扩展,涉及多维数据集的非线性问题,从一维Spearman相关分析算法到扩展的二维Spearman相关分析算法,进而扩展为三维Spearman相关分析算法等。此外,还介绍了Spearman相关算法及其扩展算法在具有迁移学习方法模型中的运用。然后,第二部分将提出的Spearman相关算法进一步扩展并用于多维数据集的信息投影和多视图非线性问题的相关模型构建。最后,利用本文提出的Spearman相关扩展算法解决了数据及图像分辨率非线性问题上的挑战。每个部分的详细说明如下:第一部分基于Spearman相关性分析的扩展,从经典的一维Spearman相关性扩展到二维Spearman相关性,进而扩展到三维Spearman相关性。本文通过提出的多个相关模型解决了数据驱动的处理问题,非线性优化和降维问题。本文模型所提出的动机在于,迄今为止,使用传统算法处理多维多媒体数据集是研究人员一直面临的局限性和挑战,因为大部分子空间学习算法由于线性和非线性数据依赖性而在大多数时候不能令人满意地执行。而所提出的Spearman相关性分析扩展模型直接找到两组多维数据集之间的关系,无需将数据转换为所需的矩阵,例如2D矩阵或相应的视觉特征向量。此外,它大大降低了多维约简和计算算法的复杂度。所提出的模型还提供了所提取的信息,以作为决策的计算依据。为此,本文所提出的三个Spearman相关分析扩展模型具体为:首先,介绍了经典的一维Spearman相关分析以及对多维数据的转移学习方法。该模型采用迁移学习策略,将所有数据输入视频分割成帧,从深度学习模型“Inception-V3”中提取深度视觉特征,然后模型使用一维Spearman相关分析在重叠视频的深层视觉特征中进行成对相关分析。最后,将余弦距离矩阵应用于线性相似背景的建模。该模型基于由多个重叠摄像机捕获的同一场景中的相似性,检测并提供区域活动之间的相关分析。此外,本文利用六个特征互不相同的典型多维数据集,来验证经典Spearman相关性的模型的性能。然后介绍了一种二维Spearman相关分析算法。本算法是通过经典Spearman相关分析算法求取多元二维单调(线性或非线性)多媒体数据集的代数解的扩展。在某种程度上,可利用该模型应对具有非线性挑战(例如不同尺寸)的两个不同图像的相关分析问题,例如将图像重塑为一维向量。所提出算法在四个重要数据集以及针对四个数据集的第五个交叉数据集进行了实验验证。最后,通过一维和二维Spearman相关性分析推理出三维Spearman相关性分析算法,提出了新的模型“深层三维Spearman相关性分析(D3D-SCA)”。所提出的D3D-SCA模型采用了三个组成部分:(1)用于深度特征映射的定制深度学习模型(InceptionV3),(2)提出的三维Spearman相关分析方法,用于直接比较成对的深度特征而无需奇异矩阵的约束。(3)定制的Xception分类器,该分类器具有自动在线更新功能和可调整的神经体系结构,适用于低延迟的移动计算模型。该模型的提出动机是基于图像到视频的检测和再识别来提高现有计算机视觉应用程序的可伸缩性。在名为“3D Objects on turntable and Caltech101”的数据集上的大量实验证明了所提出模型的有效性。研究的第二部分介绍了一种通过Spearman相关分析(SCA)进行多维信息量投影或变量多视图的算法,并利用深度学习模型通过Spearman相关分析对非线性数据进行多维投影(MD-SCA)。该算法是Spearman相关分析的扩展,可以通过成对相关分析来提取投影的线性或非线性信息。这些多维信息投影在模式识别应用程序中用作信息模式。算法通过线性代数解将SCA扩展到解决优化问题,高多维数据的双重表示问题以及深度学习模型结构难题上。此外,所提出的模型通过Spearman秩能力降低了线性和非线性数据之间的二次算法复杂度。提出的方法在两个基准标记数据集上进行实验:Face96和Yale Face Database。研究的第三部分提出了一种Deep Spearman相关分析(DSCA)模型,该模型被用于图像超分辨率的相关应用。虽然对于投影方法,如线性子空间学习算法和多子空间学习算法非常受欢迎。但是,它们在处理多维或非线性数据时存在一些局限性和关键问题。由于尺寸变化,通常会降低低分辨率图像与高分辨率图像之间非线性相关性的识别率。这为识别相关应用带来了挑战。该模型的目的是解决计算机视觉应用中的非线性分辨率问题。为此本文提出了一种称为深度Spearman相关分析方法,该方法在“ReId车辆牌照号数据集”和“MNIST手写数据集”两个数据集上进行了实验,解决高分辨率和低分辨率的二维矩阵之间的非线性问题图像并显示它们之间的相关性。它包含三个组成部分;(1)可训练的深度卷积神经网络(DCNN),用于提取深度特征图以匹配信息投影。(2)扩展的正则化Spearman相关分析算法,以匹配LR和HR图像之间的信息投影;(3)径向基函数网络(RBFN),用于将相关特征从低分辨率输入特征映射到相对高分辨率原型,它负责模式识别任务,通过定制的Xception分类器进行识别检测和分类。