论文部分内容阅读
中国古代壁画是中国艺术史上的一朵奇葩,其丰富多彩的内容,记录着各个时代的宗教信仰、社会风貌、民俗生活等,具有重要的研究价值。随着数字化技术的发展和广泛应用,壁画图像逐步实现了数字化,使得利用计算机帮助研究者分析和研究壁画图像成为可能。壁画图像数量丰富,规模极大,为艺术研究者提供了丰富的研究资料和素材,但与此同时,如何有效地利用海量的壁画资料成为一个难题。其中,如何利用计算机对海量的壁画图像资料进行分类,以及如何从海量壁画图像资料中搜索得到所需要的某一类艺术形象成为一个急需解决的问题。该问题的解决可以避免大量的人力消耗,能够极大地提高研究效率,具有重要的意义。 本文面向目前研究者所面临的需求,研究壁画图像分类技术以及壁画图像中艺术形象的定位技术,辅助研究者能够方便的从海量壁画资料里找到所需要的研究素材。不同于一般的自然图像,壁画图像是人工作品,是由能够表达艺术家绘画风格的线描组成,线描之间的组合关系构成了壁画图像的高层语义。而传统的图像分类和目标定位技术没有考虑到线描之间的组合这一重要的语义特征,因此在壁画图像分类和艺术形象定位上并不能很好的适用。此外,壁画图像具有较大的类内差异以及较强的背景噪音,传统方法在壁画图像分类以及艺术形象定位上会出现较大的误差。 本文主要针对以上问题展开研究,主要研究内容和创新包括: (1)提出了一种基于轮廓局部的特征构建方法,并用于壁画图像分类以及壁画艺术形象的定位。针对壁画图像是由各种风格的线描组成的特点,在研究了大量壁画图像的线描图结构的基础上,提出首先将线描图分割为最小的轮廓线段基本单元,然后对每一条轮廓线段构造特征描述符作为局部特征,局部特征融合了轮廓线段的长度、方向以及与周围邻居轮廓线段的关系信息,具有较高的鲁棒性。在表达整幅图像的特征时,首先对所有轮廓局部特征进行编码,然后采用在空间金字塔结构上的池化技术来实现,最后使用支持向量机实现壁画图像分类。在艺术形象定位方面,使用分支定界的搜索方式实现目标定位。与目前主流的基于梯度的局部特征(SIFT,HOG)相比,本文提出的基于轮廓的局部特征在对线条丰富的图像分类上具有明显的优势,并且是对基于梯度的局部特征的补充,实验证明两种特征的结合能够达到目前最好的分类精度以及定位结果。 (2)提出一种基于轮廓结构的壁画图像分类以及艺术形象定位方法。特定的艺术形象,特定的图案具有特定的轮廓结构,一个艺术形象的所有轮廓结构组合才能构成该艺术形象的语义,因此轮廓结构展现了壁画图像更高层的语义属性。本文提出了轮廓结构的概念并提出了轮廓结构间的相似性度量方法,并将壁画图像间的相似性度量转化为图像的整体轮廓结构间的相似性度量,然后利用这种新的度量方法结合主流的分类器模型实现壁画图像的分类。在艺术形象定位方面,首先检测图像的具有辨识力的轮廓结构,然后利用轮廓结构的最优组合关系实现艺术形象定位。轮廓结构更接近图像的高层语义,可以实现更加准确的图像或者目标艺术形象间的相似性度量,实验证明了本文方法对基于艺术形象为题材的壁画图像分类以及目标定位具有更好的效果。 (3)提出了基于分组多实例学习的壁画图像分类方法。通过对大量壁画图像的研究以及实验,发现很多情况下同类壁画样本存在较大的类内差异。当很难提出一种新的特征使得在这个特征空间中同类壁画保持相似的时候,本文从分类模型的角度提出一种分组的方式,将训练样本在某一特征空间分为几组,每一组单独的去训练分类器,这样能够减少采用统一分类器所产生的错误分类。另一方面,针对有些壁画图像存在较大背景噪音的特点,采用多实例学习的模式去从一幅图像中寻找最具代表性的子图像,用子图像的特征去训练分类器,多实例学习的方式能够较大程度的克服背景噪音对分类造成的影响。同时,多实例学习的过程是图像分类与目标定位的相互迭代过程,每一轮迭代的图像分类结果会影响目标定位结果,同时目标定位得到的子图像会作为下一轮分类器的训练样本,因此本文分组多实例学习的方法同时实现了壁画图像的分类以及艺术形象的定位。实验证明分组多实例学习的方式在针对壁画图像的分类以及艺术形象的定位方面在相同的图像特征描述下胜过目前主流的方法。 对于艺术研究而言,本文的方法具有较高的实用性,能够辅助研究人员快速的查找到研究素材,提高了研究效率。但是同时,本文的研究工作仅仅是一个起步,目前只是针对艺术形象类的素材,而且在所查素材的查准率和查全率上仍然有较大的提升空间,因此今后一方面可以继续在壁画图像的其他特征上进行深入研究以提高查准率和查全率,另一方面可以从图像的高层语义上进行分析和建模以开展基于故事内容以及基于艺术风格的壁画图像分类方面的研究。