论文部分内容阅读
距离度量学习是机器学习和计算机视觉领域一个重要的研究方向。其目的是学习一种合适的距离度量,使同类样本之间的距离更小,异类样本之间的距离更大,从而达到更好的分类性能。很多重要的机器学习算法的性能都依赖于其选择的距离度量。度量学习被广泛应用到分类、聚类、检索和身份认证等问题中,取得了很好的效果。传统的距离度量学习将每一个数据样本表示成高维空间中的一个点,然后在这些点上施加二元组约束或者三元组约束。然而,很多情况下,我们得到的数据是以集合的形式出现的,如视频图像集合等。对于这类问题上的度量学习研究还很少。基于这种现状,本文提出了一种基于三元组约束的距离度量学习方法,并将其分别扩展到点到集合、集合到集合的距离度量学习上。我们提出了一种基于点到点的三元组约束距离度量学习(RDCML)模型。对于每一个三元组(xi,xj,xk)来说,RDCML限制同类样本xi和xj之间的距离要远远小于异类样本xi和xk之间的距离,Frobenius范数正则化项和大间隔损失函数被用来进行正则化约束。我们进而提出了一种类似SVM的算法来求解RDCML模型。实验结果表明,RDCML和当前最优的距离度量学习算法相比,可以取得更好或者相当的正确率。本文将RDCML推广到了点到集合的距离度量学习问题。通过计算点到集合的距离来构建三元组,根据三元组之间的距离约束关系来学习距离度量矩阵M。通过寻找高维空间中点到集合所构成的闭合子空间上的最小距离来对特定的点进行分类。实验结果在物体识别和人脸识别数据集上得到了很好的证明。本文还将RDCML推广到集合到集合的距离度量学习问题。通过计算集合和集合之间的距离来构建三元组,然后通过不断地在三元组构建和学习距离度量M之间进行交替迭代,最终达到求解问题的目的。在物体识别数据库和视频人脸识别数据库上的实验证明,所提出的方法可以取得优异的性能。在自采集舌图像集合上的实验结果,说明本方法可以用来进行舌图像的分类,这为下一步的研究提供了很好的基础。