论文部分内容阅读
随着网络通信技术和存储技术的发展,多媒体信息由于其内容丰富、表现直观,成为人类信息表述的主要方式。如何在海量的数据中实现媒体信息的有效检索和访问,是近年来国内外研究的热点问题。基于媒体特征的文件搜索技术并不需要对媒体信息进行理解和描述,为用户提供了直观、灵活的人机交互方式,是未来的发展趋势。同时,P2P网络的非中心化结构赋予用户更多的权力,为媒体搜索提供了全新的搜索方式和更广泛的应用环境。但是目前P2P网络还不支持基于特征的搜索,仍是主要基于文件的ID(Hash值)和文件关键字进行搜索。原因如下:一方面,基于特征的搜索如果采用M-Chord等结构化搜索技术,要求特征描述必须可以按照语义映射到一维的线性空间[1],而实际情况中很难普遍适用;另一方面,如果采用非结构化搜索技术,由于P2P网络的资源分散和扰动特性,势必增加访问和比较特征描述的开销。为了解决这个问题,本文将非结构化的专门用于MPEG-7多媒体特征分布式搜索算法SWIM[2][3][4](Small World Index Method)从静态的分布式环境移植到动态的P2P环境中,并针对SWIM算法在P2P扰动环境下性能大幅下降的问题,将带有动态更新机制的Kademlia[2]算法与其结合,形成SWAD(SWIM-Kademlia)算法。该算法具有以下优势:能够广泛支持MPEG-7多媒体特征描述;采用非结构化的方式组织P2P网络,查询方式灵活;采用局部贪婪搜索算法替代传统的泛洪,有效降低搜索的开销;能够适应P2P网络的扰动特性,在频繁的节点加入和退出环境下,保持性能稳定。此外,本文还搭建测试系统,在4000规模节点的P2P模拟环境中进行测试以及实际的图片搜索,测试结果表现出较高的准确率,稳定性,图片搜索结果符合人的主观视觉感受。