基于内容的图像结构表示和分类

来源 :西北工业大学 | 被引量 : 0次 | 上传用户:huangxinyu322
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本论文研究的主要内容是基于内容的图像结构表示和分类。作为一个有着广泛应用前景的研究领域,基于内容的图像分类吸引了越来越多的研究人员参与,取得了许多研究成果并开发了一些商用和研究型系统。但由于缺少结构化的表示,基于内容的图像分类存在一定的问题。基于此,一些学者研究用神经网络表示和处理数据结构的方法,通过结构的反传算法(BPTS)学习和分类树型和图型结构信息。 本文在前人工作的基础上,分别对特征提取、结构内容的表示和分类,各种迭代网络分类器以及误差收敛曲线进行了研究和讨论。设计并实现了一个基于结构内容的图像分类系统。 在特征提取方面,总结了CBIR中成熟的颜色、纹理和形状特征提取方法。提出了一种分块主色HSV特征提取算法。实验结果证明,主色HSV相对RGB更符合人的视觉和心理感知;中心分块在描述局部信息的同时也能突出主题。 给出了图像结构化表示的数学定义以及通过结构反传(BPTS)算法的自适应处理数据结构迭代神经网络的一般框架。 提出了一种基于树型结构的自然图像表示和分类的方法。实现了对图像逐步分级的四叉树型结构(无区域分割)的表示以及在UC Berkeley的图像库分割结果基础上的自动邻接区域二叉树和人工生成多叉树型结构表示。讨论了几种不同迭代神经网络模型的分类器以及通过结构反传的树型结构的学习流程。实验结果表明,基于迭代神经网络的结构表示和分类方法具有很强的结构学习能力,而且相对于传统的BP网络,分类性能有很大的提高。同时,基于分割结果的树型表示,尤其是人工生成的多叉树涵盖更多的语义信息且能得到较好的分类结果。 最后,对比了不同网络结构和不同的隐层神经元个数对分类结果以及误差收敛曲线的影响。从迭代神经网络的输入样本入手详细分析了错误的实例并提出了本文的不足和今后的研究方向。
其他文献
近年来,随着Internet的飞速发展,越来越多的研究机构、团体以及个人开始注意到网络,并通过它来发布信息、查找信息。尽管Internet上有海量的信息,人们还是常常感到不能够找到
随着互联网在规模上的飞速扩展和在应用上的广泛普及,人们的工作和生活已经越来越离不开网络。特别是网络多媒体技术的出现,给人们的工作和生活都带来了许多方便,诸如视频会
随着移动通信与计算机技术的发展,移动智能设备被广泛应用在人们日常生活中,大量的信息被存储在这些设备上,同时由于经常性的交互,这些信息通常存在着多个副本。为了在人们之
虚拟企业是适应市场需求的有效组织模式,它融制造技术、现代信息技术和管理技术于一身,是未来企业合作的理想组织形式。起源于办公自动化领域的工作流技术可以对虚拟企业起到
本文主要对信息抽取中的命名实体识别和模板自动获取两个技术进行了研究,并提出了一套有效的解决方案.在命名实体识别方面本文重点研究了中文人名的识别和机构名的识别.本文
文章首先介绍了PBNM(policy_based network management)的思想及其在园区网络管理中实施的意义,给出了课题的设计目标和任务;然后,对系统进行了总体分析,针对用户的需求和现有的
随着我国国家信息化工程的建设发展,各行各业都建立了各自的信息处理系统,但是,目前企事业等单位现有的软件往往由不同的部门开发,软件之间相互独立,自成系统,数据标准不一致
随着经济的发展及科学技术的进步,各行各业面临的是一个日益复杂和不断变化的环境,决策问题变得越来越复杂,特别是对于面向多层次、多目标的复杂系统决策问题,因涉及到多种专业知
随着Internet技术的发展,计算模式不断更新,信息系统基本架构也从C/S架构逐渐发展为当今主流的B/S架构。各种设计模式的提出与使用对信息系统的开发产生了越来越大影响,模式采用
语音识别技术自诞生以来就对人类的生活方式产生了深远的影响,因此语音识别技术一直以来都是世界各地学者们深入研究的热点。目前语音识别广泛采用动态时间规整(DTW)技术和基