最大间隔方法及其在图像检索中的应用

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:rgypf1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着图像获取、传输、存储等技术的进步,各种数字图像资源变得越来越丰富。为了对图像资源进行有效的利用,首先要求能够快速准确地从规模日益庞大的图像数据库中查找到需要的图像。图像检索是一个综合性的问题,为建立一个成功的图像检索系统,需要首先解决许多相关的基本问题,如图像相似性的度量、图像相关排序、图像分类以及聚类等。近年来,机器学习理论与算法的长足发展为各种实际问题的解决提供了有力的工具。在众多的机器学习算法中,支持向量机模型因在理论上具有坚实的基础并在实践中表现出优异的性能而受到广泛的关注。本文在支持向量机模型和间隔最大化准则的基础上,提出了一系列最大间隔算法,对图像检索中相关的问题展开了研究。本论文首先研究了当用局部特征表示图像时,如何通过局部特征的匹配,度量图像之间的相似度,并在此基础上用支持向量机实现图像分类。文中提出了一种新颖的双空间金字塔匹配算法,能够快速地计算两个特征集合间的隐式匹配关系。该算法首先对特征空间和图像空间分别进行多分辨率的划分,然后将一幅图像对应的局部特征的集合映射成建立在双空间中的多分辨率直方图,最后通过直方图的加权相交实现两个特征集合的快速匹配。由于充分利用了局部特征在两个空间中的分布特点,因此相比于只在单空间中进行匹配的算法,双空间金字塔匹配能够更准确地反映局部特征集合之间的关系。同时,基于双空间金字塔匹配的相似性度量满足半正定条件,因此能够作为支持向量机的核函数,用于对图像进行分类。在ImageCLEF医学图像分类任务上,基于双空间金字塔匹配的支持向量机取得了比2005年公布的最佳参赛结果更小的分类错误率。本论文然后研究了在基于关键词的图像检索中,如何有效地将图像按照与关键词的相关程度的大小进行排序。与传统工作将检索问题建模成二分类问题并优化分类性能不同,本文将问题建模成一个排序学习问题,并直接优化与排序性能相关的目标函数。本文基于支持向量机模型和间隔最大化准则提出了一种新颖的多示例排序学习框架。该框架采用基于区域的图像表示,并利用一组具有优先关系的图像对学习图像排序模型。利用学到的排序模型,能够计算新图像的排序分数,并按排序分数的大小对图像进行排序。在这个框架下,基于对区域和图像排序分数关系的不同假设,本文分别提出了三种具体的多示例排序学习算法。对从Flickr上搜集的图像进行的实验表明,多示例排序学习算法能够极大地提高图像的排序质量。这项工作是最早将排序学习与多示例学习结合进行考虑的工作。本论文还研究了基于支持向量机模型和间隔最大化原理的聚类算法,由此可以对图像进行聚类。这种最大间隔聚类算法通过寻找使类间间隔最大的分类面,实现对数据集的划分。与传统的聚类算法相比,最大间隔聚类具有良好的推广性能,因此在大规模的聚类问题中能够发挥重要的作用。本文在分析现有最大间隔聚类算法不足的基础上,提出了基于成对约束的半监督最大间隔聚类算法。该算法通过在最大间隔聚类的目标函数中添加针对成对约束的损失项,使得求得的聚类分界面尽量满足给定的约束条件,从而提高最大间隔聚类的性能。本文不仅在标准支持向量机模型的基础上讨论了两类情况下的聚类,还从多类支持向量机出发,详细讨论了多类情况下基于成对约束的最大间隔聚类。对于聚类问题所对应的非凸优化问题,本文提出了基于CCCP过程的迭代解法来进行高效地求解。在多类情况下为了保证聚类速度,还为CCCP迭代中子问题的求解提出了基于割平面法的快速算法。对标准的图像数据集进行聚类的结果表明,成对约束的引入,能有效地弥补现有最大间隔聚类算法的不足,并极大地提高其聚类准确性。
其他文献
2019年高考试卷中有关直线和圆的试题主要为求直线和圆的几何要素或方程问题、面积问题、位置关系问题、定点问题和应用问题.解决涉及直线和圆的问题时要注意以方程思想、转
目的研究开展绿色通道髓内钉内固定治疗老年股骨转子间骨折对围术期术前等待时间、手术时间、围术期失血等的影响,为临床治疗提供数据支撑。方法回顾分析2015年1月-2018年12
不同大气环境下,人体的主观感受是不同的,舒适度正是对此种感受的反映。无论是日常生产活动的进行,还是社区群体、个人生活活动的开展,都避免不了受气象环境的影响,只有及时
在软件组织中,对软件过程资产等知识进行有效管理是进行过程改进、保证组织持续发展的重要基础。当前,知识管理在管理领域、人工智能领域和软件工程领域得到广泛重视与研究。一