基于内容的图像检索中特征表示与检索策略研究

被引量 : 0次 | 上传用户:hdazf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着网络和计算机技术的飞速发展,社会进入了以“大数据”为标志的网络数据时代,近年来,《Nature》和《Science》等国际顶级刊物相继出版专刊来探讨对“大数据”的研究。对网络数据的研究对维护社会稳定、推动社会发展、提升行业竞争能力、促生新兴战略性产业及对科学研究的方法论有着重要的作用。而网络数据的重要组成部分——图像,作为包含丰富信息内容的多媒体信息,随着Internet的日益普及和网络技术的不断发展,越来越成为网络数据的主流。如何挖掘蕴含在巨大图像数据中丰富的信息,如何实现对这些图像数据的有效组织、分析、管理,已成为网络数据时代信息处理领域的一个重要的发展方向和研究热点。网络图像数据具有:数据量巨大、维度和信息分辨率较高、非结构化的数据形态、解释的多样性、模糊性和不确定性。这些特点使得相关领域的研究成果难以被直接借鉴于对网络图像数据的研究。如何合理的组织、表达、存储、查询和检索这些海量的图像数据是目前我们面临的亟待研究和解决的问题,也是一个重大的挑战。因此,如何建立高效的图像检索模型和方法,能够交叉多学科,综合运用数字图像处理、模式识别、统计学习、机器视觉等理论与方法并与传统数据库技术结合起来,能够根据图像的底层视觉属性特征建立起与高层语义信息的有效关联,给出性能良好的图像检索模型与方法,检索出用户所需的、满意的图像具有重要的理论意义和现实的价值。于是,基于内容的图像检索技术便成为解决这一问题的研究重点和趋势。目前的检索模型与方法很难满足人们的需求,其主要原因是目前对图像描述和表达多数还是基于底层物理属性特征,与用户的意图,即高层语义信息(如描述的图像主题类型、事件、表达的情感等)间存在巨大的鸿沟。因此,一方面我们需要研究更高效的图像描述与表达的模型与方法,另一方面就是充分利用用户信息,架起底层视觉特征和高层语义概念之间的桥梁。本文针对以上问题,综合运用机器学习、图像处理、人类视觉认知机制等理论和方法,尝试展开了相关研究工作,研究检索过程中对图像的描述和表达、基于动态反馈的检索机制、基于视觉注意机理的检索机制三个方面的问题。本文主要工作如下:1.基于改进随机游走的图像检索经典的基于随机游走的图像检索是一个相对比较完善的检索模型与方法。然而,在随机游走的过程中一般没有考虑到图像分量特征的重要性以及图像间的空间关系等因素,在图像表示及检索效率上往往会遇到问题。针对以上问题本文提出了三个解决策略:首先,基于图像的特征在检索中的重要性,考虑采用特征选择方法,通过给图像分量特征加权,来表征每维特征的重要程度。基于拉普拉斯得分具有很好的局部保持能力,因此在特征加权方面,采用高效的拉普拉斯得分方法。其次,考虑到每幅图像的K近邻充分体现了图像的空间结构关系。因此。在随机游走的过程中结合K近邻选择方法。在相关反馈的过程中通过寻找所有相关和不相关图像的K近邻,很大程度提高了随机游走的检索效率。这样保证了问题的解更全面更优。在经典的数据库上和运用不同的图像特征将本文提出的方法与目前几种流行的检索方法进行了比较,实验结果也显示我们的方法优于其他方法。最后,我们在基于随机游走的图像检索框架上提出,包含特征加权和K近邻方法的层次检索策略。实验结果表明,在图像特征相同的条件下,在不同的数据库上,本文方法的检索结果明显优于其他两种对比方法。检索结果的精准率和召回率方面,本文的方法优于其他两种对比实验方法,在运行时间上本文的方法与经典的基于随机游走的图像检索方法基本相当。2.基于动态流形更新特征的反馈式检索与传统的线性降维算法相比,流形学习方法的主要特点是假设分布在高维空间中的样本点处于或者近似地处于非线性流形上。而流形学习的目标就是发现数据集中的非线性流形结构并在降维的同时尽可能地保持这些结构信息。基于最大边缘准则(Maximum Margin Criterion, MMC),本文提出了动态流形更新特征的反馈式检索策略。该方法基于最大化类间平均边缘来寻求最优的线性子空间,并充分利用用户反馈信息,动态建立查询流形空间。因此,MMC能提高算法计算效率,同时,MMC可以有效避免小样本问题。首先,利用用户选择的相关图像,使用MMC对原始特征进行绛维,获取特征变换矩阵。然后,将特征变换矩阵作用于原始特征进行特征变换,根据更新后的特征和用户标记样本,采用随机游走算法计算所有样本的得分。最后,将得分最大的前K张图像显示给用户,直到满足条件为止。实验表明,基于最大边缘准则的动态流形更新特征的反馈式检索策略,表现出了很强的泛化能力,优于基于单样本检索方法,具有较高的检索性能。3.基于互信息描述符的图像检索本文提出了一种互信息描述符方法实现对图像的描述和表达,用于图像检索。互信息描述符的提取和表示是在视觉认知机制指导下完成的,该方法遵从人类视觉认知机制及人眼结构来提取特征,并模拟神经系统传输信息的过程进行特征融合。在潜意识阶段利用互信息描述符提取特征,并在意识阶段将其表达,从而进行检索。互信息描述符针对锥状细胞和杆状细胞对颜色和方向较敏感的特点提出方向及颜色敏感图,因此互信息描述符符合人眼视网膜细胞获取特征的机理。互信息描述符的表示是在模拟神经系统传递信息的过程中进行的。在特征融合过程中,基于机器学习理论,模拟周围环境,为视细胞提取的特征进行约束加权,最终通过特征向量将图像在“大脑”中重构。因此,互信息描述符包含了颜色、形状、纹理等特征,以及特征的分布情况,且具有一定的空间定位性。同时互信息描述符具有较低的维度,这样大大降低了算法的时间与空间复杂度。实验表明,互信息描述符与边缘方向直方图、微结构描述符等经典图像检索方法相比,具有较高的索引能力,且具有平移、仿射不变性,能够更准确、全面的检索图像。
其他文献
<正> 数学与烹饪似乎是风马牛不相及的事,但是随着社会的进步,科学技术的发展,中国烹饪要想发展,要想实现烹饪的工业化,就必须改变落后的生产方式和传统的烹饪观念,积极引进
在中小学信息技术课教育中 ,加强对学生计算机兴趣的正确引导 ,培养他们正确使用信息技术的道德意识和社会责任感。融德育于信息技术教学当中 ,帮助学生树立正确的世界观 ,培
P2P网络借贷,通常称为“人人贷”,是指个体和个体之间通过第三方平台在网络上实现直接借贷的金融模式。概念中涉及两方面,一是资金的出借方,通常为个人,另一个是资金的需求方
蓝莓产业在国际及国内市场上已经展现出巨大潜力,尽管我国的蓝莓产业起步较晚,但最近几年已经成为我国发展最快的新型产业之一。近些年,国内外针对蓝莓中花青素的研究大部分局限
根据1996 年12 月27 日沪宁高速公路上雾的观测资料分析, 揭示了辐射雾的双层结构和爆发性发展的特征, 分析了辐射雾发展的物理过程, 讨论了影响辐射雾生消过程的逆温结构和湍流混合问题
横竖是该出事了,一向老实巴交的王清秀竟敢和伟大领袖唱反调。一句“枪杆子里面出枪子”,使革委会挖出了一个货真价实的历史反革命。铁证如山,面对山谷里那白花花的尸骨,他无
本文主要针对多元化背景下学生多元化的特点,利用侨校的优势进行基于问题解决的研究性学习模式的研究与探索,运用实验研究法、行动研究法等研究方法组织教学改革实践,对教学
我国农村土地主要以农村集体经济组织内部家庭承包方式进行经营管理,发包方为村集体经济组织或村民委员会,承包方则是本集体经济组织的农户。国内外学界对我国土地制度的研究
随着我国政治经济体制改革的深入发展,大政府向小政府的转变,在政府与社会关系转型的进程中,社区逐步承载原先由政府和企事业单位包揽的社会事务,城市居民由“单位人”变为了“社
税收筹划指的是纳税人在税收政策法规指导下,充分行使纳税人权利,对自身涉税行为进行科学合理安排,目的是实现税后利益最大化而采取的税务决策方法。在目前我国税收制度日趋