基于区域的图像语义自动标注方法研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:yufengdetianxia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于区域的图像语义自动标注是计算机视觉研究的基础任务和关键技术之一,在图像检索及图像理解等领域有着广泛的应用。本文以室外静态图像作为研究对象,研究了图像全局特征提取,局部特征提取及语义映射三个方面,建立一种尽可能准确的图像标注模型。论文研究内容如下:1)针对现有图像语义自动标注模型在图像全局特征提取时存在的图像分割不准确以及网格分块的局限性问题,提出了一种联合纹理、空间位置和Lab颜色信息的自适应多特征图像分割算法——GAMFS。该算法使用颜色、空间位置和纹理多重特征,解决了过分割和欠分割问题,并利用邻域内像素相似度的迭代更新自动获取阈值,提高了算法的自适应性,通过对标准图像库进行标注实验,证明该方法避免了分割不准确造成的全局特征描述不确切的问题。2)针对基于分割区域的特征提取在图像语义标注中准确度较低的问题,本文提出使用图像的局部不变特征对图像进行进一步描述,并针对现存局部不变特征提取算法存在的问题,提出了一种基于尺度不变的快速局部特征描述算法——Multi Resolution Wavelet Transform Descriptor。算法利用多尺度小波变换实现方向可变滤波,并利用强度、距离和方向可变滤波的联合分布建立描述子,降低了光照变换引起的不稳定性,解决了现有算法存在的维度过高,速度过慢的问题。3)为了解决标注中存在的语义鸿沟问题,提出一种自动图像语义标注框架,将标注分为图像处理、语义学习和语义标注三部分。其改进之处体现在两个方面:一是结合全局特征与局部特征,构建底层特征矩阵;二是建立低层特征与高层语义的关联矩阵,用归一化频率计算相似度,并提出基于经验熵的互信息方法解决矩阵的维数灾难问题。实验证明该方法较好的解决了标注准确度低和标注速度慢的问题。
其他文献
由于加工一个MEMS器件的周期较长,经费较高,因此,在设计之初都要进行仿真来验证所设计的结构是否符合实际需求。为此,本组在之前开发了虚拟工艺软件,旨在通过仿真得到器件的三维结
P2P技术是目前计算机网络领域的一个研究热点,它的发展将影响人们获取信息的方式和整个计算机网络的概念。P2P充分利用网络节点的自身资源,实现整个网络资源的高效共享。副本
基于摘要的垃圾邮件识别方法是众多垃圾邮件识别方法中十分重要的一种。这类技术通过对比邮件摘要相似性来判定垃圾邮件。然而,现有的识别技术大都采用集中式的摘要管理模式,该
随着通信技术日新月异的发展,相关的科研理论不断与时俱进,三维模型由于自身巨大的优势而逐渐成为主流,并广泛应用于虚拟现实、机械制造等行业领域,尤其在三维模型语义标注与
在众多数据挖掘技术中,多分类器融合技术是近几年来的研究热点,它利用多个分类器来解决问题,可以显著提高系统的泛化能力,达到比个体分类器更好的分类精度和鲁棒性,受到许多
可扩展标记语言XML(extensible Markup Language)已逐渐成为Web上对数据进行表示和交换的标准格式。随着XML使用的日益广泛,越来越多的数据库厂商考虑将XML数据的管理融入到传
随着网络技术的发展和互联网规模的扩大,互联网上的信息不断的增长,如何有效的检索这些海量信息成为Web信息检索领域的重要研究课题。在信息检索系统中,检索模型和检索系统的性
生物识别技术是一种用智能机器来模拟辨别验证身份的一种技术,其中人脸识别技术可以利用人脸部的生理或行为特征来检测图像中的人脸位置或识别出人的身份。由于人脸形态多变
图切割问题一直以来都是组合优化领域中经典并且活跃的主题,对此类问题的研究不仅对多物网络流问题、模糊聚类编辑问题(Fuzzy Cluster Editing).有向图中的反馈顶点集问题(DF
随着全球经济的一体化以及我国经济体制改革的进一步深化,使得国内中小企业都面临着巨大的挑战,管理体制的不完善成为中小企业发展的瓶颈。采购、库存、销售是中小型商贸企业的