图像语义融合关键技术的研究

来源 :中国矿业大学(北京) | 被引量 : 0次 | 上传用户：bravehearterdoctor

【摘要】

：

数字图像的井喷式增长为图像的充分利用提供了坚实的基础,挖掘出图像内容背后隐含的深层次语义信息,也是图像理解领域的重要任务。图像数量的增长对于图像理解的准确度和图像

【作者】

：

倪景秀

【出处】

：

中国矿业大学(北京)

【发表日期】

：

2018年01期

【关键词】

：

语义标注语义融合模糊聚类图像分割空间金字塔

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

数字图像的井喷式增长为图像的充分利用提供了坚实的基础,挖掘出图像内容背后隐含的深层次语义信息,也是图像理解领域的重要任务。图像数量的增长对于图像理解的准确度和图像处理的速度提出了更高的要求。首先,图像理解的智能化,要求尽可能地缩小图像内容表示和图像语义理解之间的语义鸿沟。其次,海量图像对于图像处理的时间性能也提出了更高的要求。因此,高效准确地对图像进行自动语义标注迫在眉睫。目前,已有大量研究人员对基于语义的图像标注和图像语义融合等算法展开研究,但是图像理解领域仍然存在许多亟待解决的问题,主要表现在以下三个方面:(1)现有的图像标注的效率和准确率无法满足海量图像的处理需求。图像数量的大幅增长对图像工程的关键技术提出了前所未有的挑战。图像分割、图像语义标注、图像语义融合等算法的性能直接影响图像检测和图像分类等后续环节的准确度。因此,如何实现准确高效的图像自动标注是一项很有挑战性的研究工作。(2)现有的图像分割忽略了图像的空间信息或图像子块之间的位置关系,导致图像分割准确率不高。在图像分割算法中,颜色信息是很重要的图像属性。因为颜色直方图具备旋转不变性、平移不变性和缩放不变性等优势,所以颜色直方图的应用较为广泛,但是,因为颜色直方图缺乏像素点的位置信息,所以颜色直方图也在一定程度上影响了图像分割和图像分类的准确率。在颜色直方图的基础上,附加上像素点或图像子块的位置信息,可以减少错误分割,提高图像分割的准确性,这是一项有意义的研究工作。(3)不同的标注系统产生的图像标注词在语义上存在歧义或冗余。将图像的不同标注信息进行融合,给图像提供完备的、准确的语义信息,这是一项很有意义的工作。目前的图像理解系统在处理图像语义时,很难挖掘出图像内容以外的高级语义,比如场景语义和情感语义。因此,图像检索的结果与人们的需求之间还存在着难以逾越的语义鸿沟。旨在消除计算机理解和人类实际需求之间语义鸿沟的图像语义标注和图像语义融合是当前图像理解领域的研究热点。针对以上问题,本文进行了以下三个方面的研究创新工作。(1)提出一种基于分层的图像语义标注模型。该模型充分利用了图像的全局特征和局部特征的不同作用。整个模型的工作流程分为模型训练阶段和图像标注阶段。在模型训练阶段,利用场景语义树的结构,将场景语义和图像的视觉特征建立关联。在图像标注阶段,利用待标注图像的全局特征将图像归类到某一特定场景,并找到场景对应的场景语义树。然后,根据待标注图像的局部视觉特征,图像在场景语义树中游走,直到某个叶子节点为止,图像在场景语义树中所经过的所有节点的语义标注词的集合即为该图像的语义标注。本文构建了场景相关的场景语义树,对场景内的语义信息进行合理的组织和管理,从而提高图像标注质量。此外,本文提出的语义标注算法在视觉特征的处理过程中采用了模糊聚类算法,这也在一定程度上提高了本文标注算法的准确度。在本文算法中,语义标注词的选择需要结合自然语言处理的语义提取机制,对图像提供的标注词也要符合自然语言的语义层次。根据以上几条标准,本文对于常见的几种场景分别建立对应的场景语义树。(2)提出一种基于模糊聚类和空间信息的图像分割算法。该算法结合图像的颜色直方图和空间金字塔,实现了不同尺度的图像颜色直方图信息提取,促使图像子块的分类和分割更加灵活。由于空间金字塔本身包含了各尺度下图像子图的位置信息,因此,本文提出的图像分割算法大大提高了图像分割的准确率。(3)提出一种基于语义相似度和多特征融合的图像语义融合算法。该算法将两个图像的语义信息进行融合,得到更为全面、更加准确的图像信息。本文提出的基于语义相似度和多特征融合的图像语义融合算法,主要有以下四点贡献:第一,给出语义概念之间相似度的计算方法,以衡量不同语义之间的接近程度;第二,为不同的视觉特征赋予不同的权值,体现了不同特征在图像分类中的不同重要性;第三,权值不同的语义信息使得图像语义融合的结果更加全面和完备;第四,在形成最终语义标注词的过程中使用了 FCM模糊聚类方法,将大量存在冗余的标注词集合用模糊聚类的方法进行集约,保留核心标注词,提高了图像标注的准确性和完整性。通过不同数据集上的实验数据验证,本文得出了以下结论:(1)提出了一种基于分层的图像语义标注模型,充分发挥图像的全局特征和局部特征在图像分类中的不同作用,构建了场景相关的场景语义树,提高了图像语义标注的准确性并降低了标注的时间复杂度。(2)提出了一种基于模糊聚类和空间信息的图像分割算法,该算法结合图像的颜色直方图和空间金字塔,提高了图像分割的准确率。(3)提出一种基于语义相似度和多特征融合的图像语义融合算法,将两个相关图像的语义信息进行融合,得到更加全面的标注信息。

其他文献

超重力法吸收醋酸尾气中试研究

为解决在用醋酐法生产HMX的过程中挥发出来的大量醋酸溶剂，采用中试用的超重力旋转填料床对醋酸尾气进行吸收。采用生消水作为循环吸收剂，考察了超重力因子、液体流量和循环时

期刊

超重力法旋转填料床吸收醋酸尾气

MiniFiler及Yfiler试剂盒无创产前亲子鉴定的可能性探究

目的采用Mini FilerTM及YFilerTM试剂盒对孕妇血浆进行STR分型,评估上述试剂盒进行无创产前亲子鉴定的可行性。方法采用Mini FilerTM及YFilerTM试剂盒,对2例成人男性的全血及

期刊

法医物证学无创产前亲子鉴定STR

CUL4B在结直肠癌干细胞调控中的作用及其分子机制

CUL4B作为骨架蛋白参与构成Cullin4B-RING E3连接酶复合物(Cullin 4B-ring ubiquitinligases,CRL4Bs),通过催化组蛋白H2AK119单泛素化或底物多泛素化而介导蛋白降解,参与调控

学位

CUL4BCCSCsmiR34aPDOsMYCN

基于机器学习的水稻发育期预测模型构建

采用机器学习中的支持向量机(SVM)方法,建立以适应区域尺度生产指导为目的的水稻发育期预测模型。通过整合水稻发育期数据和气象数据,构建训练集与测试集,并应用SVM算法建立

期刊

水稻发育期模型支持向量机(SVM)

拖拉机液压悬挂机构自动控制系统

在原拖拉机半分置式液压悬挂机构中改进设计了自动控制系统。分别阐述了自动控制系统的组成、工作原理、土壤阻力传感器、农具提升高度传感器、主控制阀位移传感器信号的测取

期刊

液压悬挂机构换向阀传感器油缸自动控制

笔墨之外求蹊径梁同书的《行书轴》

<正>清代乾嘉时期,以写帖著名的书家主要有梁(?)和梁同书。这二位书家都酷爱用羊毫写行草书,平生留下数量极多的作品,时名高、求者众,在当时被合称为“南北二梁”。也有人把

期刊

梁同书《行书轴》

浅谈日语中的外来语

一个国家的语言及文字都有各自的特点。说到日语的语言特点,必须要说外来语。日语的词汇,从语源来分,大致分为和语﹑汉语﹑外来语三大类。外来语就是指从外国语言中引入到日语中

期刊

外来语起源发展使用作用

新形势下中小企业管理创新关键因素分析

随着我国经济的不断进步和发展,国内各个方面都有了很大的进步和发展,尤其是我国的中小型企业迎来了发展的春天。特别是这几年国家支持中小型企业的发展,出台了相关的政策,为

期刊

新形势中小企业管理创新关键因素分析建议

不同种源四川桤木嫁接幼苗光合及叶绿素荧光特征研究

四川桤木（Alnus ledgeriana）适应性强,木材用途广,被列为优质造纸用材树种,是我国西南地区的速生用材树种和四川省重要的乡土树种,具有广阔的发展前景。本试验通过研究不同种源

学位

种源四川桤木嫁接幼苗生长状况光合作用叶绿素荧光

一级相变磁制冷材料的基础问题探究

由于一级相变磁制冷材料发生磁相变时有晶胞体积的突变,相变过程中有相变潜热存在,其磁化过程中有许多磁学问题有待于进一步探究.本文以LaFe13-xSix合金为研究对象,在现有对

期刊

一级相变磁熵变滞后两相共存

图像语义融合关键技术的研究

其他学术论文