论文部分内容阅读
随着计算机网络的发展和多媒体压缩技术的逐步成熟,多媒体数据在网络上的传播变的日益普及,使得多媒体数据的拷贝和分发变的容易。因此,如何保护媒体的数字版权,己成为当前亟待解决的问题。基于内容的图像拷贝检测为版权保护提供了一个有效的手段,主要分为特征提取和索引构建两个部分。本文中,图像特征选取全局信息特征(GIST)描述符, GIST可以以紧凑的描述符向量表示图像,每幅图像对应高维特征空间中的一个点,从而可以使用很多经典的算法对图像匹配问题进行处理;在GIST特征向量基础之上,利用主成份分析(PCA),顺序测度(OM),局部保持投影(LPP)和最大熵模型(EM),将GIST特征描述符转化为二进制比特序列。由于顺序测度是基于排列而不是真正的值本身并且局部保持投影能够保持原始数据的局部结构信息,所以经过处理之后的特征序列具有极低的维度并且具有一定的抵抗几何攻击的能力。图像拷贝检测另一个问题是索引的构建。对于高维的特征向量,传统的索引构建方法面临着“维度灾难”的问题,不适用与构建大量高维的向量。本文提出了一种基于哈希序列的二级索引构建方法,一级索引中具有相同哈希码的图像存放在同一个桶中;二级索引结构中存放与当前哈希码距离小于一定值的相邻哈希编码。在查询过程中,采用递归的方法对得到的新哈希码集合继续在二级索引结构中扫描。实验表明,本文提出的特征提取算法具有较好的鲁棒性,能够得到较高的系统性能,基于哈希序列的索引结构具有较快的查询时间。对于大量的待查询图像,本文提出了一种基于分组的查询算法,与随机查找相比,基于分组的查询算法具有较少的IO读写次数,使得系统响应时间较快。