结构化语义描述和特征选择在图像语义理解中的研究与应用

来源 :天津大学 | 被引量 : 0次 | 上传用户:dmf625
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,随着社交媒体以及手持电子拍照设备的迅速发展,互联网上的图像以惊人的速度增长着,这无疑给图像理解带来了新的挑战。如何高效,准确的理解这些图片成了计算机视觉领域的一个热点问题。本文将从两方面入手对图像理解进行研究与分析:1),研究基于语义团的高层图像描述方法,该方法可以编码物体之间的高阶依赖关系,进而可以有效的提高场景分类的准确率。2),研究基于高层语义的特征选择模型,针对特定的语义场景,选择最有判别力的底层特征子集,从而在物体识别和场景分类中获得更好的效果。在方法1)中,本文提出了一个以物体团作为属性的图片表示方法。相比于基于单个物体的描述,基于物体团的描述符能包含更多地语义信息,这样可以有效缩小语义鸿沟。在方法2)中,本文提出了两个模型引导有监督的结构化稀疏的特征选择:空间路径编码(SPC)和语义图上的物体编码(OCSG)。SPC是一个正则项,它用来编码金字塔模型下得到的特征之间的空间关系。在SPC模型中,每一维的特征都被看成是一个有向无环图中的一个顶点,特征间的空间关系被看成是带权值的有向边。这样,有监督的特征选择的过程就可以直接形式化到最小代价路径选择问题。与其他目前最好的分类和识别方法相比,SPC模型取得最好的实验结果。在OCOG模型中,先对大量的带标签的图片进行统计,并且计算物体之间的依赖度,得到先验知识。然后,用一个图对物体间的语义关系建模。这个语义图把每个物体看成是一个顶点,物体之间的语义关系看成是带权边。由于把语义关系编码到语义图里边,OCSG能够自动的选择出一个物体团的集合表示特定的场景。实验结果表明OCSG能够帮助提高场景分类的准确度。
其他文献
随着因特网在规模上不断膨胀,功能上不断扩展,服务器的负担越来越重,客户/服务器模式的低效率以及难以扩展的缺陷慢慢暴露出来,它已经不能适应现在的大规模因特网时代。对等网
三维激光扫描仪是数字化设计与制造的关键设备之一。采用三维激光扫描仪能够快速采集原型样件的表面数据,在产品设计和工业检测领域已得到广泛应用。将扫描测量数据导入逆向工
随着互联网技术的飞速发展以及社会经济水平的日益提高,越来越多的人愿意出去旅游也使得在线旅游业蒸蒸日上,用户通过在线旅游平台查找景点并预定支付。但旅游平台上存在严重的
随着信息技术的发展,现代社会越来越多的行业及领域需要使用计算机处理大规模的各种数据。其中一类数据必须用图数据的方式来表示。对包含亿万个顶点和边的图数据进行高效、紧
随着网络通信、信息技术的发展,信息安全越来越受到人们的关注。数据加密算法DES作为典型的分组加密算法,虽然已被穷举法攻破,但因为此前DES加密应用比较广泛,还是有很好的应用基
感知纹理在计算机视觉,模式识别等领域是重要的研究课题,不论是在互联网传输领域还是人们实际生活中都有着重要的意义。本文通过对感知纹理分类实验结果的分析,探寻纹理中某些看
现代医学、航空航天、自然监控和军事等应用领域迫切需要高效的计算机方法在自然环境中实现目标搜索与跟踪。由于自然场景的复杂性,这些任务通常具有高复杂度并且对响应速度
Z-Wave协议是一种新物联网协议,它虽然简单高效,但是也存在一些问题,例如消息传输效率不高、结点负载能力弱、数据传输率低和安全性能较低等问题。在物联网智能家居领域,迫切需要
针对城市大量供热企业能耗高,缺乏统一有效的节能检测及监控技术的现状,天津市科委开发了智能化节能检测及监控系统,但是对于像天津这样的大型城市,热源厂、热力公司、公、民建筑
图像分类技术是指利用计算机软件等相关技术根据图像自身信息中所反映的不同特征,将特征不同的目标或区域划分开来的图像处理方法。传统的图像分类技术则利用对图像的特征提取