论文部分内容阅读
图像的低阶可视化特征是独立、客观的直接可以从图像中获取的信息,传统的基于内容图像检索主要利用它来完成计算机对图像的相似性判断。但是,人对于图像的需求往往是基于某种语义的,而从视觉数据中可提取到的信息与用户对相同数据的解释却缺乏一致性,无论提取到的低层特征如何,都很难用这些特征直接推导出语义。因此,研究图像低层特征和高层语义之间的联系,建立它们彼此之间的映射,就成为解决问题的关键。
研究者普遍认为:在基于内容的图像检索中合理的引入人工智能和机器学习技术是解决高层语义难题的有效途径。通过机器学习相关算法进行分类或聚类来划分图像所属类别从而标识图像所表达的语义,是主要采取的方法。本文就是针对图像低层特征到高层语义映射算法展开研究的,主要做了以下几方面的工作:
1.支持向量机(Support Vector Machine-SVM)作为新近出现的机器学习方法,以其良好的分类性能受到广泛关注,取得了丰硕的研究成果。本文在分析、总结现有支持向量机多类分类方法的优缺点基础之上,分析了图像低层特征的特点,确定使用基于模糊C均值聚类的SVM多类分类方法作为机器学习算法,建立分类二叉树来完成图像低层特征到高层语义的映射,并分析了选择此分类策略的原因。
2.传统的基于聚类的SVM多类分类方法在聚类时并不考虑样本的类别信息,最终形成的二叉树分支一般很多,当遇到图像低层特征这样异类样本特征相近的情况时该方法性能下降明显。针对这一问题,本文将线性判别分析法(Linear Discriminant Analysis-LDA)引入二叉树建树过程之中,提出融合LDA的SVM多类分类方法。每次在对待训练样本集聚类之前先进行优化处理,通过寻找最佳投影子空间使得同类样本聚集、异类样本松散,从而优化二叉树结构,以此改进分类效果。在UCI数据集上的实验结果表明本文方法减少了二叉树分支的同时提高了分类的准确率。
3.详细讨论了融合LDA的SVM多类分类方法在图像语义映射中的具体实现与应用。通过Corel图像库上的实验表明,该方法是切实可行的,基本满足图像语义映射的要求。
4.因为图像情感具有模糊性的特点,所以不能将一幅图像确定的归于某一种情感类别。针对这一问题,再对本文提出算法进行调整,将结果模糊化,通过参数调节来完成图像情感语义映射。最后通过中科院CAPS图像库中选择图像进行实验,验证算法的可行性和准确性。