融入直方图相交核的局部稀疏编码图像分类算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:rocxdp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习已经广泛应用到实际生活的各个领域。随着互联网的高速发展,每天有数以亿级的图像被上传,下载,给计算机视觉中的图像自动分类带来巨大的挑战。当今搜索引擎耗费大量的人力物力用于标注图像库中的图像的类别,在用户搜索某类图像时,将用户输入的关键字和图像的标注进行匹配,获得候选的图像集返回给用户。如果能够提高图像自动分类的准确率,由机器自动将图像库中的图像分类,当用户查询时,直接返回给用户该类别的图像,将节约大量的人力,同时大幅度提高工作效率。可以通过两种方式提高图像分类的准确率:(1)学习优秀的分类器,例如非线性SVM,复杂神经网络等等(2)学习优秀的特征,使用简单的分类器本文的工作主要通过学习鲁棒的图像特征表示来提高图像的分类准确率。稀疏编码和局部稀疏编码方法是非常有效的图像特征提取方法,不过它们是在直方图空间进行编码。直方图相交核(Histogram Intersection Kernel)是一种应用于图像处理的特定的核函数。该核函数将直方图特征映射到高维空间,实现特征的非线性映射。本文结合了局部稀疏编码和直方图相交核的优点,在直方图相交核的映射空间中,完成每个直方图的局部稀疏编码,然后生成整幅图像的编码,最后验证该方法的有效性。为了完成这个目的,我们需要:(1)提取图像的直方图特征,例如SIFT,HOG特征(2)使用EM算法学习直方图相交核对应的映射空间下的字典(3)优化带有线性约束的最小二乘问题,求解每个直方图在映射空间下的局部编码(4)使用池化和空间金字塔匹配方法形成图像的编码(5)使用线性分类器对形成的特征分类,比较和分析不同方法的实验结果实验表明,本文提出的方法能够显著提高图像分类的准确率。和传统局部稀疏编码(在直方图空间下)相比,本文的方法形成的图像特征更具有线性判别性,获得的分类准确率更高。
其他文献
生物信息学是综合运用生物学、数学、物理学、信息科学以及计算机科学等诸多学科的理论方法的崭新交叉学科,它是整个生命科学发展的重要组成部分,己成为生命科学研究的前沿。生
随着计算机技术的飞速发展,计算机动画、科学计算可视化和虚拟现实成为计算机图形学领域中三大重要技术,而三维真实感图形又是这三大技术的核心内容。OpenGL凭借其强大的渲染功
由于Web Service具有平台和语言的独立性,使得它受到广泛的应用,目前Web Service已经成为当今Web应用系统中不可缺少的重要内容之一。对于台式PC来说,目前已经有比较成熟的Web S
随着信息技术的高速发展,信息资源的规模愈发庞人,导致管理难度大大增加,因此需要采用有效的知识管理方法来处理海量信息。由于本体提供了对领域知识的共同理解,确定了该领域内共
粗糙集理论是继概率论、模糊集理论、证据理论之后的又一个处理不确定性的数学工具。知识约简算法是粗糙集理论的核心内容。寻找决策信息系统的最优约简或全部约简是NP问题,
学科分类体系可以揭示科学发展的规律,并能在一定程度上预测学科进一步发展的趋势,有助于科研管理工作者制定政策。随着科学知识迅猛增长,学科分类体系动态性日益明显。如何构建
长期以来,电信企业大量而详尽的电信业务数据只被简单的应用在各种业务系统中,而没有被更有效的开发利用。随着电信市场的竞争日趋激烈,如何利用这些数据为电信业提供决策支持服
决策树方法是数据挖掘的重要方法,通常用来形成分类器和预测模型。决策树方法包含多种不同的算法,其中ID3算法是决策树方法的典型代表,是决策树生成最常用的具体实现方法,它利用
粗糙集理论是一种新的刻画不完整性和不确定性的数学工具。知识约简是粗糙集理论研究的核心问题之一。目前,粗糙集理论正在被广泛应用于人工智能、模式识别等很多领域。本文对
随着互联网和大型局域网迅速发展,网络带宽的不断扩充,给我们带来方便的同时也导致用户数与日俱增,传统的认证管理模式已无法满足大型局域网中用户对网络安全性、高效性和低成本