融合LDA和多类SVM的图像语义映射研究

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:laumingka
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像的低阶可视化特征是独立、客观的直接可以从图像中获取的信息,传统的基于内容图像检索主要利用它来完成计算机对图像的相似性判断。但是,人对于图像的需求往往是基于某种语义的,而从视觉数据中可提取到的信息与用户对相同数据的解释却缺乏一致性,无论提取到的低层特征如何,都很难用这些特征直接推导出语义。因此,研究图像低层特征和高层语义之间的联系,建立它们彼此之间的映射,就成为解决问题的关键。   研究者普遍认为:在基于内容的图像检索中合理的引入人工智能和机器学习技术是解决高层语义难题的有效途径。通过机器学习相关算法进行分类或聚类来划分图像所属类别从而标识图像所表达的语义,是主要采取的方法。本文就是针对图像低层特征到高层语义映射算法展开研究的,主要做了以下几方面的工作:   1.支持向量机(Support Vector Machine-SVM)作为新近出现的机器学习方法,以其良好的分类性能受到广泛关注,取得了丰硕的研究成果。本文在分析、总结现有支持向量机多类分类方法的优缺点基础之上,分析了图像低层特征的特点,确定使用基于模糊C均值聚类的SVM多类分类方法作为机器学习算法,建立分类二叉树来完成图像低层特征到高层语义的映射,并分析了选择此分类策略的原因。   2.传统的基于聚类的SVM多类分类方法在聚类时并不考虑样本的类别信息,最终形成的二叉树分支一般很多,当遇到图像低层特征这样异类样本特征相近的情况时该方法性能下降明显。针对这一问题,本文将线性判别分析法(Linear Discriminant Analysis-LDA)引入二叉树建树过程之中,提出融合LDA的SVM多类分类方法。每次在对待训练样本集聚类之前先进行优化处理,通过寻找最佳投影子空间使得同类样本聚集、异类样本松散,从而优化二叉树结构,以此改进分类效果。在UCI数据集上的实验结果表明本文方法减少了二叉树分支的同时提高了分类的准确率。   3.详细讨论了融合LDA的SVM多类分类方法在图像语义映射中的具体实现与应用。通过Corel图像库上的实验表明,该方法是切实可行的,基本满足图像语义映射的要求。   4.因为图像情感具有模糊性的特点,所以不能将一幅图像确定的归于某一种情感类别。针对这一问题,再对本文提出算法进行调整,将结果模糊化,通过参数调节来完成图像情感语义映射。最后通过中科院CAPS图像库中选择图像进行实验,验证算法的可行性和准确性。
其他文献
可视目标跟踪已经广泛应用于民用和军事的许多领域,如视频监控、机器人导航、图像压缩等,因此对可视目标跟踪的研究有着非常重要的意义。Mean Shift算法是一种非参数的密度梯
数字电影以其卓越的画音效果、始终如新的放映质量、丰富多样的节目资源、便捷高效的创作手段、低廉高效的传输发行方式、方便可靠的版权保护等特点,已成为当代世界电影发展的
目前,针对企业或部门的计算机应用已不仅仅停留在诸如文档处理、信息发布等这些简单的业务层面上。越来越多的企业或部门要求将信息技术的应用扩展到跨企业、跨部门的业务过程
在日常的校务管理活动中,很多工作都需要多人参与,以共同完成某项任务。然而现有的校务管理系统在协调多个人员来完成某一个任务方面存在着严重的不足,严重影响了办公效率。工作
随着3G时代的到来,移动电话已经成为人们生活中不可或缺的工具,成为了移动信息时代管理个人事务、工作和生活的工具,而与其相关的软件市场更是具有无穷发展潜力。人们也不再满足
公有云环境向用户提供了大量可租用的资源,例如不同性能的虚拟机、不同带宽的网络和不同的存储容量。科学工作流是由一系列计算任务组成,来完成一些科学计算目标的任务集合。
2002年钻井地质设计系统在胜利油田地质录井公司投入使用,该系统提供了数据管理、数据查询、报告生成等功能,极大地方便了设计人员的地质设计工作。但是,该系统缺乏决策支持
随着网络的广泛应用,网络安全问题也越来越严峻。当前网络攻击方法层出不穷,入侵规模不断扩大,使得目前防火墙等被动的网络安全机制对许多攻击无能为力。入侵检测技术作为一
随着社会的信息化发展,信息安全已成为人们在信息社会中生存与发展的重要保障。数字签名作为现代密码学的重要组成部分,是提供认证性、完整性和不可否认性的重要技术,在网络通信
目前,对入侵检测系统的研究主要集中在入侵检测系统模型和入侵检测技术两个方面。现有的系统模型随着网络规模的扩大和人们需求的不断增长,将增加传输负载,造成通信“瓶颈”。传