面向图像语义描述的场景分类研究

被引量 : 14次 | 上传用户:xiange
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何让计算机按照人类理解的方式对海量图像数据进行高效地分类与管理,成为了图像理解领域中一个亟待解决的问题。场景分析与理解为图像的语义分类提供了可能,场景分类被明确认定为是图像语义分类中的一个关键课题。本文主要成果有:(1)提出一种基于局部熵加权特征融合的场景分类方法。鉴于不同的特征描述子适合描述不同类型的场景图像,本文针对两种局部特征描述子进行特征融合以增加场景图像特征描述的区分力。首先,通过计算图像的局部熵定量分析场景图像的复杂度,据此定义平坦度,并通过叠加场景类内每幅图像的平坦度获得该场景类的平坦度;其次,提取两种分别适用于描述区域平滑和区域变化的局部特征描述子,并分别进行图像直方图描述;然后,利用场景类图像的平坦度计算两种局部特征的权系数,并对两种基于独立的局部描述子形成的图像直方图描述加权融合,获得场景类图像的最佳描述;最后训练概率生成模型,完成场景分类任务。实验结果表明,该方法对于不同类型的图像特征描述具有一定的普适性。(2)提出一种基于超像素网格空间金字塔图像描述的场景分类方法。鉴于传统的词包模型图像描述方法忽略空间信息的缺点,本文采用上下文特征和空间金字塔图像描述来加入图像的空间信息。首先,构建多尺度上下文特征使其能够保证特征描述时加入局部空间结构信息;其次,对图像进行超像素网格分块,网格的分辨率由金字塔层数决定;然后,对各层次上超像素网格分块得到的各个图像子块依据视觉词典生成图像直方图描述,并按照一定的权重组合在一起形成整幅图像的直方图描述;最后,训练分类器,完成场景分类任务。本文采用的超像素网格分块,避免了图像中对象的强制分割,从而保证了子区域内对象语义的一致性。实验结果验证了场景分类过程中上下文信息和超像素网格分块的优越性。(3)提出一种基于局部约束线性编码特征映射方式的场景分类方法。提取图像的视觉特征并聚类生成视觉码本以后,依据码本进行视觉特征映射形成图像描述。本文提出一种基于最大求和合并法的局部约束线性编码方式特征映射方法,将前t个概率最大的码字进行线性加权取平均作为特征映射编码结果,并分析讨论t的取值对于场景分类性能的影响,并讨论了不同的码本长度与场景分类性能之间的关系。实验证明,该方法提高了特征码字之间的相关性和特征映射的鲁棒性,取得了较好的场景分类性能。
其他文献
近年来,物联网行业蓬勃发展,其中物品的位置信息正成为诸多研究人员关注的热点和重点。全球定位系统(Global Positioning System,GPS)由于其精确性和快速性成为人们获取物品位置信
电力产业是我国的国民经济支柱产业,它的发展与否关乎着国民基础产业的发展,关乎着民生。电力产业一直以来都是全世界各个国家优先发展的重点,只有电力行业发展了,其它的行业才会
赵孟頫在中国书法史上以其非凡的才华造就了辉煌的一生,也成为历史上备受争议的一位艺术家。因其生逢宋元易代之际又以赵氏皇族后裔的特殊身份出仕元朝,并在元朝为官三十多年,在
休闲农业,作为一项功在当代、利在千秋的新世纪朝阳产业,其发展过程中蕴含了深刻的时代背景。伴随着人民生活水平的日益改善,体验经济的时代已昂首阔步地朝我们走来,在此基础上党
目的:探讨丝裂原活化蛋白激酶激酶5(Mitogen activated protein kinase kinase5, MEK-5)、细胞外信号调节激酶5(Extracellular signal—regulated kinases5, ERK5)、磷酸化细
早在许多年前邓小平同志就曾提出“科学技术是第一生产力”和“科教兴国”战略,科技发展是一个国家综合国力的体现,也是在国际竞争中处于不败地位的有力武器。随着我国科学技
进入21世纪以来,信息化技术的迅猛发展,尤其是互联网与网络技术的普及,企业的管理方式也在不断发生变化。信息化管理在企业以及公司的发展过程中发挥着十分重要的作用。其中客户
受限于检测时间和成本要求,CT和背散射等新兴X射线成像技术还没有广泛应用于安检领域,在很长一段时间内,相对成熟的基于单源双能的X射线透射成像技术仍然是主流安检成像技术
目的:比较椎旁肌间隙入路和传统正中入路在治疗胸腰段骨折的临床疗效及对椎旁肌损伤的差异性。方法:采用前瞻性对比研究,选取安徽医科大学附属省立医院骨科2010年6月-2012年6月
汉代到唐代是我国历史上非常重要的时期。从汉代开始成立乐府,从民间广搜诗歌,西汉武帝时更是达到了顶峰。三国两晋南北朝则上启秦汉,下启隋唐,这一时期社会动荡,民族迁徙,加速了我