基于加权多特征融合和SVM的图像分类研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:fyfy76
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于内容的图像分类技术主要取决于图像特征的提取技术和分类器的构造方法。支持向量机(Support Vector Machine,SVM)具有监督学习能力,泛化能力强,是一种高效的分类器,因此基于SVM的图像分类技术成为众多学者研究图像分类的重要理论基础。本文主要研究了多分类器的构造及如何融合多特征向量来训练SVM分类器,使模型具有较高准确率。本文针对图像内容的基本特征提取算法分别作出了简单介绍,选择鲁棒性较好的提取算法。针对颜色提取,本文选择基于RGB颜色统计的提取算法,分别提取出图像的R、G、B颜色分量直方图。针对纹理提取,本文选择由灰度共生矩阵导出纹理特征的方法。本文针对形状特征提取,选择了Canny边缘检测算子提取边缘轮廓,结合不变矩的方法来描述形状特征。本文研究了多分类器的构造方法,在二叉树SVM多分类器的基础上作出了改进,提出了改进后的二叉树SVM多分类器的构造方法。通过计算图像特征向量间的欧氏距离来衡量两类图像的相似度,进而根据相似度选择分类顺序,选择相似度低的优先分类,避免了二叉树SVM分类由于正类数目少导致的分类结果只集中在负类一边的结果。本文对原二叉树SVM多分类器和改进后的分类器作对比实验,验证了改进后的多分类器的有效性。本文在基于对特征融合的研究上提出了基于加权的特征融合方法来融合各特征向量,与以往的融合方法不同,本文提出的融合方法是基于正类被正确分类的数目。然后将融合后的特征向量作为SVM的输入向量,在改进后的多分类器上进行如下实验:对于数据集中的每个种类,对比其在基于单一特征被正确分类最优时结果与其在基于多特征融合被正确分类最优时的结果,以此证明基于多特征融合的分类较优。此处比较的是各种类基于不同方法进行分类的最优结果。本文特征融合的权值是依据类别在基于单一特征分类较优时的正确分类数目。因为种类较多,正类数目较少于负类数目,所以此处对比的基准结合分类准确率和正类被正确分类的数目。通过对比不同实验结果,验证了本文特征融合方法的有效性。
其他文献
建立Deep Web集成系统是目前的研究热点,但由于不同网站对同一实体的数据描述在表现形式上存在着差别,导致冗余信息多,给用户的查询带来不便。实体识别是Deep Web集成系统中
随着计算机软件在各个领域的广泛应用,计算机软件变得愈加的庞大与复杂,软件缺陷预测作为软件开发生命周期中的重要环节,可以及时的发现和纠正开发过程中的缺陷,避免软件后期
随着Internet高速发展与大面积普及,网络攻击也在不断出现。随着攻击技术的不断进步与更新,攻击工具和手法的日趋复杂,攻击工具的使用却越来越简单,现在的异常检测系统面临着
文本分类技术是从庞大而杂乱的文本中准确而快速的识别所需信息的关键技术。在文本分类的过程中,文本被送入分类器之前首先要对文本进行预处理工作,包括文本分词、去停用词、
本文是针对网格数据挖掘平台(本文中指的是BillionGrid平台)进行的工作流设计。在BillionGrid平台中,对于数据挖掘的处理方式是用户每请求处理一次数据便调用一个数据挖掘算
近年来,办公自动化(OfficeAutomation, OA)渐渐成为国内外众多企业、服务性行业提高工作效率的主要手段。随着以计算机技术和通讯技术为代表的信息技术的发展,工作流技术逐渐
在自然语言处理领域,高质量的标注语料在信息处理中有重要的应用价值,语料库质量的好坏直接影响到中文信息处理的各项后续工作的展开。对标注语料的高质量精加工要求也迫切至
伴随着Internet技术的快速发展和多媒体技术的广泛运用,流媒体极大地提升了人们的网络应用服务体验。传统的Internet传输表现形式太过单一,实时流式传输技术彻底摆脱了这一弊
变分推理应用变分迭代计算出随机变量的近似期望值,是现代人工智能学科一种重要的近似概率推理方法。由于随着变分迭代次数的增加,变分迭代过程涉及到的变量越来越多,但新增
当今,以信息科学技术为先导的社会变革,全面推动着社会的发展。现代社会进入了以网络信息为中心的信息时代,越来越多的企业希望采用管理信息系统来提高企业工作效率和增强企