论文部分内容阅读
图像检索作为多媒体信息检索技术的一个主要组成部分,在信息检索领域占有举足轻重的地位。因此图像检索得到了快速的发展,并产生了许多关于图像检索的算法。根据不同的实际问题和应用领域,采取相应的检索算法。鉴于现阶段大量体育方面的图像,论文针对排球场景的检索进行了相关的研究。
针对排球场景的图像检索是基于内容的图像检索的具体应用,可以结合图像的颜色和形状等信息检索其内容。论文检索了排球场景中其摄像头拍摄的图像,包括检索摄像头拍摄到的相似图像、有较大的排球图像以及摄像机的机位这三方面的内容。在实现过程中,要去除图像中光照、噪声和背景等信息,所以首先应对图像进行了相关的预处理。在检测摄像机机位过程中,通过Hough直线检测排球场景中的网带信息来判断机位。论文根据网带的形状和方向特征对Hough直线进行了改进,提高了算法的效率。在检测排球方面,主要运用了Canny边缘提取和Hough圆来检测排球信息。论文采用了随机Hough圆来检测排球,但是随机Hough圆的三个采样点之间是毫无关联的,所以提出了一种改进的随机Hough圆算法即把三个采样点关联起来,并且结合了排球的颜色信息,提高了算法的效率和准确率。在查询相似图像方面,采用单元格熵和位平面相结合的方法对图像进行相似性比较。信息熵相比颜色直方图对存储空间要求较低,单元格熵则包含了图像的空间信息,位平面分解可以提取图像中有意义的高位平面从而了提高算法的准确性。
最后,论文运用VC++6.0实现了上述的算法。通过对大量排球图像的检索,实验结果表明,改进的Hough直线和Hough 圆在检测排球场景中的网带和排球具有很高的准确性,并且利用基于位平面的单元格信息熵的方法相比传统的直方图方法有了很大的提高。其中,算法在查找摄像机机位,其准确率高达95[%];查找有较大的排球图片,其准确率也达到93.1[%]。基于位平面的单元格信息熵识别相似图片其查准率和查全率分别为87.2[%]和92.3[%]。由此说明,此算法能够满足检索的基本要求。