面向壁画的图像分类及艺术形象定位技术研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:hhmlyj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中国古代壁画是中国艺术史上的一朵奇葩,其丰富多彩的内容,记录着各个时代的宗教信仰、社会风貌、民俗生活等,具有重要的研究价值。随着数字化技术的发展和广泛应用,壁画图像逐步实现了数字化,使得利用计算机帮助研究者分析和研究壁画图像成为可能。壁画图像数量丰富,规模极大,为艺术研究者提供了丰富的研究资料和素材,但与此同时,如何有效地利用海量的壁画资料成为一个难题。其中,如何利用计算机对海量的壁画图像资料进行分类,以及如何从海量壁画图像资料中搜索得到所需要的某一类艺术形象成为一个急需解决的问题。该问题的解决可以避免大量的人力消耗,能够极大地提高研究效率,具有重要的意义。  本文面向目前研究者所面临的需求,研究壁画图像分类技术以及壁画图像中艺术形象的定位技术,辅助研究者能够方便的从海量壁画资料里找到所需要的研究素材。不同于一般的自然图像,壁画图像是人工作品,是由能够表达艺术家绘画风格的线描组成,线描之间的组合关系构成了壁画图像的高层语义。而传统的图像分类和目标定位技术没有考虑到线描之间的组合这一重要的语义特征,因此在壁画图像分类和艺术形象定位上并不能很好的适用。此外,壁画图像具有较大的类内差异以及较强的背景噪音,传统方法在壁画图像分类以及艺术形象定位上会出现较大的误差。  本文主要针对以上问题展开研究,主要研究内容和创新包括:  (1)提出了一种基于轮廓局部的特征构建方法,并用于壁画图像分类以及壁画艺术形象的定位。针对壁画图像是由各种风格的线描组成的特点,在研究了大量壁画图像的线描图结构的基础上,提出首先将线描图分割为最小的轮廓线段基本单元,然后对每一条轮廓线段构造特征描述符作为局部特征,局部特征融合了轮廓线段的长度、方向以及与周围邻居轮廓线段的关系信息,具有较高的鲁棒性。在表达整幅图像的特征时,首先对所有轮廓局部特征进行编码,然后采用在空间金字塔结构上的池化技术来实现,最后使用支持向量机实现壁画图像分类。在艺术形象定位方面,使用分支定界的搜索方式实现目标定位。与目前主流的基于梯度的局部特征(SIFT,HOG)相比,本文提出的基于轮廓的局部特征在对线条丰富的图像分类上具有明显的优势,并且是对基于梯度的局部特征的补充,实验证明两种特征的结合能够达到目前最好的分类精度以及定位结果。  (2)提出一种基于轮廓结构的壁画图像分类以及艺术形象定位方法。特定的艺术形象,特定的图案具有特定的轮廓结构,一个艺术形象的所有轮廓结构组合才能构成该艺术形象的语义,因此轮廓结构展现了壁画图像更高层的语义属性。本文提出了轮廓结构的概念并提出了轮廓结构间的相似性度量方法,并将壁画图像间的相似性度量转化为图像的整体轮廓结构间的相似性度量,然后利用这种新的度量方法结合主流的分类器模型实现壁画图像的分类。在艺术形象定位方面,首先检测图像的具有辨识力的轮廓结构,然后利用轮廓结构的最优组合关系实现艺术形象定位。轮廓结构更接近图像的高层语义,可以实现更加准确的图像或者目标艺术形象间的相似性度量,实验证明了本文方法对基于艺术形象为题材的壁画图像分类以及目标定位具有更好的效果。  (3)提出了基于分组多实例学习的壁画图像分类方法。通过对大量壁画图像的研究以及实验,发现很多情况下同类壁画样本存在较大的类内差异。当很难提出一种新的特征使得在这个特征空间中同类壁画保持相似的时候,本文从分类模型的角度提出一种分组的方式,将训练样本在某一特征空间分为几组,每一组单独的去训练分类器,这样能够减少采用统一分类器所产生的错误分类。另一方面,针对有些壁画图像存在较大背景噪音的特点,采用多实例学习的模式去从一幅图像中寻找最具代表性的子图像,用子图像的特征去训练分类器,多实例学习的方式能够较大程度的克服背景噪音对分类造成的影响。同时,多实例学习的过程是图像分类与目标定位的相互迭代过程,每一轮迭代的图像分类结果会影响目标定位结果,同时目标定位得到的子图像会作为下一轮分类器的训练样本,因此本文分组多实例学习的方法同时实现了壁画图像的分类以及艺术形象的定位。实验证明分组多实例学习的方式在针对壁画图像的分类以及艺术形象的定位方面在相同的图像特征描述下胜过目前主流的方法。  对于艺术研究而言,本文的方法具有较高的实用性,能够辅助研究人员快速的查找到研究素材,提高了研究效率。但是同时,本文的研究工作仅仅是一个起步,目前只是针对艺术形象类的素材,而且在所查素材的查准率和查全率上仍然有较大的提升空间,因此今后一方面可以继续在壁画图像的其他特征上进行深入研究以提高查准率和查全率,另一方面可以从图像的高层语义上进行分析和建模以开展基于故事内容以及基于艺术风格的壁画图像分类方面的研究。
其他文献
随着信息技术、脑与认知等技术的发展,有关脑科学领域的研究越来越深入,大量相关的文献资料和数据不断涌现,如何及时获取并分享这些信息成为脑科学发展中非常迫切的问题。传统信
现在大多数编程语言采用的是虚拟机的实现方式,即把源代码编译成平台无关的字节码,然后交由虚拟机解释执行这些字节码。纵观大部分编程语言的虚拟机实现方式,基本上都采用了基于
云计算是近年来IT领域的一个热门话题,普遍被业内人士认为是下一代互联网技术的基础,并将会影响到整个互联网产业的格局。当前,国内外都涌现出一批成熟的云计算产品,极大地推动了
脑-机接口(BCI)技术在大脑和外部设备之间建立直接的通讯通道,该通道跨越人体外周神经和肌肉系统,直接对外部设备进行控制,与外界环境进行交流。脑-机接口技术通常又被称为mind-
三维点云的曲面重建是计算机图形学和计算机辅助设计中的基础问题之一,在影视特效、三维游戏、三维打印、虚拟现实、数字博物馆、数字城市、逆向工程等领域有着广泛的应用。针
随着计算机技术和空间信息技术的不断发展,空间信息技术已经在众多行业得到了广泛应用。但与此同时,空间信息数据质量和数量的不断增加,给数据存储、数据检索等方面带来了巨大压
近年来,云计算技术作为移动计算、大数据技术的助推平台,开始广受平台提供方和消费方的关注,巨大的开发群体和开发投入同时促使云计算高速发展。国外的亚马逊平台通过云计算技术
互联网发展得越来越快,在线获取最新消息已经成为几乎每个互联网用户每一条都在做的事情。海量的数据也造成了严重的消息过载问题,所以用于获取信息的网站上,消息的推荐系统具有
车载自组织网络以车辆为基本信息单元,可以使车辆实时监测到其附近道路上其他车辆的相关信息,通过车与车、车与路边单元的实时信息交互来保证车辆行驶安全、规避道路拥塞和提
任何的计算机系统都包含一定比例的重复代码。这些相似的代码片段的存在不仅使得整个系统显得臃肿并导致性能的下降,而且对于程序的理解,维护,移植,重构等都造成了很大的影响。重