基于直推式多示例学习的图像分类算法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:lijing202740
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体、英特网等技术的快速发展,以及近年来数码产品的普及,产生的数字图像呈爆炸性地增长。如何对这样的海量数字图像进行有效地管理并将其应用到各个领域已经成为新的研究热点,其中如何对这些图像进行分类就是一个急待解决的重要问题。传统的图像分类方法通常基于人工标记,但这种方法存在着两个难以解决的问题:一是受制于人自身的因素,人工标记的图像往往带有强烈的主观性;二是人工标记图像工程浩大,费时费力,难以大量地进行。基于内容的图像分类技术发展于上个世纪九十年代,该方法通过提取图像的底层特征,再进行一系列的处理与学习,最终达到分类的目的。虽然基于内容的图像分类技术已经取得一些研究成果,但是已有的方法通常基于图像的单一特征进行处理,而图像中包含的内容通常不止一个,单一的特征不足以充分地描述图像,而多示例学习方法由于其特殊性可以很好的处理这个难题。本文在深入研究多示例学习及支持向量机的基础上,提出了两种新的多示例学习方法来解决图像分类问题。本文的主要研究内容如下:1、提出了一种基于直推式支持向量机技术的多示例学习算法DD-TSVM。该方法采用多样性密度算法寻找示例空间中的局部极值点,采用寻找到的局部极值点来构建特征空间,将包非线性映射到重新构建的特征空间中去,最后采用直推式支持向量机来训练分类器。该算法有效利用了未标记样本,基于Corel图像数据库的实验结果表明,DD-TSVM算法具有良好的性能。2、针对多示例学习训练数据中存在冗余数据的问题,提出了一种新的多示例学习算法DDRS-TSVM。该算法在DD-TSVM算法的基础上引入基于邻域的粗糙集技术来处理多示例学习训练数据,消除冗余数据对算法分类效果的影响,基于Corel图像集的实验结果表明,DDRS-TSVM算法效果较DD-TSVM算法有所提高。
其他文献
随着计算机的快速发展,数字图像已经成为一种重要的信息载体。无论是在日常生活和工作中还是在科学研究中,无时无刻都会有大量的数字图像产生。另外,当今社会亦是一个网络高度发
评论是一种评判事物价值的重要主观信息,其已被广泛应用于现有的商品属性抽取、偏好学习以及情感分析和挖掘。然而,评论自身也存在价值层次,能否精准高效地自动评估评论的价值(如
当今社会,从生产调度到经济分析再到生物医药,这些领域无不存在大量需要解决的优化问题。尤其是电子商务行业的兴起,现代物流业迎来了发展的高峰期,而物流配送作为其中最关键
随着计算机硬件和计算机图形学的发展,基于物理模型的流体模拟算法受到了研究学者的广泛关注,也逐渐成为计算机图形学研究热点之一,本文主要内容就是围绕了基于物理模型的烟
Top-K支配查询返回数据集中支配其它数据点个数最多的前K个点,它继承了Skyline查询和Top-K查询的优点而避免了二者的缺点,在偏好搜索、多标准决策支持等领域具有重要作用。目前
云计算是以互联网为基础的新一代技术的总称,是并行计算、分布式计算和网格计算的综合发展。云计算技术将计算资源以服务的形式提供给用户使用,广泛应用于海量信息的存储和快
随着现代数字技术的发展,各种功能强大的数字图像处理工具应运而生,给人们带来了诸多便利。但与此同时,这些先进工具也被一些怀着各种目的的不法分子利用,他们对图像恶意篡改,导致
机器人技术是一项综合性的应用技术,高度交叉了包括人工智能、机械、电子以及自动化控制在内的多门学科,是当代最智能的自动化应用之一。仿人机器人作为真正字面意义上或狭义上
本文针对纬编平针织物人工质检中的精度差、费时多、易出错等诸多弊端,研发了基于机器视觉的纬编平针织物拉伸密度快速测量系统。  根据纬编平针织物的特性,提出了一种基于织
随着互联网技术的迅猛发展以及存储、数字化设备性能的提升,视频数据量呈现几何级数增长的趋势。如何高效检索这些海量视频成为一个急需解决的问题。目前对这些视频检索和组织