论文部分内容阅读
基于内容的图像分类技术主要取决于图像特征的提取技术和分类器的构造方法。支持向量机(Support Vector Machine,SVM)具有监督学习能力,泛化能力强,是一种高效的分类器,因此基于SVM的图像分类技术成为众多学者研究图像分类的重要理论基础。本文主要研究了多分类器的构造及如何融合多特征向量来训练SVM分类器,使模型具有较高准确率。本文针对图像内容的基本特征提取算法分别作出了简单介绍,选择鲁棒性较好的提取算法。针对颜色提取,本文选择基于RGB颜色统计的提取算法,分别提取出图像的R、G、B颜色分量直方图。针对纹理提取,本文选择由灰度共生矩阵导出纹理特征的方法。本文针对形状特征提取,选择了Canny边缘检测算子提取边缘轮廓,结合不变矩的方法来描述形状特征。本文研究了多分类器的构造方法,在二叉树SVM多分类器的基础上作出了改进,提出了改进后的二叉树SVM多分类器的构造方法。通过计算图像特征向量间的欧氏距离来衡量两类图像的相似度,进而根据相似度选择分类顺序,选择相似度低的优先分类,避免了二叉树SVM分类由于正类数目少导致的分类结果只集中在负类一边的结果。本文对原二叉树SVM多分类器和改进后的分类器作对比实验,验证了改进后的多分类器的有效性。本文在基于对特征融合的研究上提出了基于加权的特征融合方法来融合各特征向量,与以往的融合方法不同,本文提出的融合方法是基于正类被正确分类的数目。然后将融合后的特征向量作为SVM的输入向量,在改进后的多分类器上进行如下实验:对于数据集中的每个种类,对比其在基于单一特征被正确分类最优时结果与其在基于多特征融合被正确分类最优时的结果,以此证明基于多特征融合的分类较优。此处比较的是各种类基于不同方法进行分类的最优结果。本文特征融合的权值是依据类别在基于单一特征分类较优时的正确分类数目。因为种类较多,正类数目较少于负类数目,所以此处对比的基准结合分类准确率和正类被正确分类的数目。通过对比不同实验结果,验证了本文特征融合方法的有效性。