论文部分内容阅读
图像分类是计算机视觉研究领域中的热点内容,在图像检索、图像标注、监控视频分析等应用中起着重要的作用。近年来,机器学习、人工智能及多媒体信息技术等学科的发展极大地推动了图像分类技术的研究与应用。尽管图像分类技术已经形成一套成熟的流程,但设计具有性能良好且计算高效的分类算法仍然具有挑战性。特别是在实际应用中,图像分类技术仍面临着各种各样的困难,如光照变化、姿态变化、遮挡、训练样本不足以及样本分布差异等等。基于上述背景,针对图像分类技术存在的一些问题,本文运用计算机视觉和机器学习中的相关方法与技术,围绕图像分类中图像表示模型和分类模型两部分开展研究,主要工作成果及创新点如下:1.提出基于朴素贝叶斯K近邻的快速图像分类算法;朴素贝叶斯最近邻算法(NBNN)有效避免了视觉词袋模型中特征量化所引起的量化误差,但该方法运行速度慢、易受噪声信息干扰,并且仅利用特征的最近邻进行分类决策。针对上述问题,本文在保留NBNN算法优点的基础上,提出一种基于朴素贝叶斯K近邻的快速分类算法(NBKNN)。一方面,使用特征的K近邻分类决策,并去除背景信息对分类性能的影响;另一方面,采用特征选择的方式分别减少测试图像和训练图像集的特征数目,以提高算法的运行速度、减少噪声信息对分类性能的影响;并尝试同时减少测试图像和训练图像集中的特征数目平衡分类正确率与分类时间之间的矛盾。2.在朴素贝叶斯最近邻算法原理框架下,提出基于低秩稀疏分解与协作表示的图像分类算法;当前,大部分基于参数学习的图像分类算法为了获取较高的分类正确率,均需要大量的训练样本进行参数学习。然而在实际应用中,往往存在训练样本不足或获取成本过高等问题,并且噪声、光照、遮挡、复杂背景等各种因素使得上述问题更加突出。另一方面,尽管同类别的图像存在一定的差异性,但它们之间同样具有潜在的相似性和相关性,如果充分利用这种性质将有益于最终的分类识别。为此,本文在NBNN算法原理下提出一种非参数化的图像分类算法。基于非负稀疏编码和最大值汇聚,将同类别的训练图像表示为具有低秩性质的特征矩阵;在此基础上,利用带有结构不一致性约束的低秩稀疏分解构建字典并学习低秩投影矩阵。分类过程中,使用低秩投影矩阵对测试图像进行投影,在NBNN算法原理的框架下,采用协作表示对其进行分类。同时,基于上述思想,假设一次性可以获取同类别的多个测试图像,本文也提出了一种图像集分类算法。最后在不同的标准图像分类集中对本文所提算法进行了验证与实验分析。3.提出基于多稀疏表示和在线字典学习方式的域适应图像分类算法;传统图像分类算法的研究一般假设训练样本和测试样本源于同一个域(图像集),具有相同的分布形式,然而这种假设在实际应用中很难得到满足。针对此问题,本文提出一种基于特征表示的域适应图像分类算法。为了减小源域和目标域中样本分布的差异性,假设源域和目标域之间存在若干个中间域。算法基于稀疏表示将图像表示为具有固定长度的BoVW特征向量,在中间域子空间建模时引入在线字典学习方法,一方面保证了样本的重构误差最小,另一方面使得源域至目标域的连接尽量光滑。最终基于源域、各中间域和目标域子空间字典形成更具区分性能的增广特征向量,并用于跨域分类识别。实验结果验证了本文算法的有效性,并证实了当训练样本和测试样本源于不同域时,基于域适应的图像分类方法取得的分类正确率更优。