论文部分内容阅读
随着WWW的急剧增长以及多媒体技术和通讯技术的飞速发展,快速有效地进行互联网多媒体信息检索、查询和浏览,成为人们的迫切需求。现存的图像搜索引擎,大多是采用基于文本关键字和链接信息来进行图像的搜索和检索,并没有利用图像本身的视觉内容信息,其检索精确度受到一定的限制。而一些基于内容的图像检索系统则仅仅利用图像的内容信息来进行图像检索,难于解决语义鸿沟的问题。针对上述缺陷,研究了Web图像中文本语义和图像视觉内容特征的综合关联等关键技术,并开发出视觉与语义相结合的图像搜索引擎VAST(VisuAl & SemanTic Image Search Engine),从而提高Web图像搜索的准确度,同时提供给用户多样的查询方式。图像搜索引擎VAST的存储与索引系统对网络图像进行视觉信息和语义信息的融合索引,为图像数据管理和检索请求提供操作接口。自适应模糊聚类是图像搜索引擎VAST存储与索引系统的基础算法,也是图像索引树构建的关键所在。自适应模糊聚类及其动态层次索引树具有动态灵活、不依赖样本数据对象等特点,很好地克服了模糊C-均值聚类对聚类中心的敏感性以及聚类的局部性,该结构对网络图像数据各种分布特性的高维特征集都具有较好的平衡对称性。VAST图像搜索引擎存储与索引系统的并行存储架构是另一个研究重点。该并行架构通过Linux物理文件系统与服务之间的接口VFS来屏蔽存储系统的实际物理操作,当上层发出图像文件操作的系统调用时,系统核心执行图像搜索系统特有的系统调用。该架构使得索引数据可以分布式存储、并行处理,这样可以增加I/O速度,从而加快检索速度。系统采用JAVA语言实现了网络图像的聚类索引库的建立,并为用户检索界面的JSP代码提高了检索接口,另外系统通过JNI技术调用图像处理包完成了16维图像特征的提取以及语义融合。并行存储架构的建立是由集群系统和C代码以及部分SHELL代码共同实现。系统测试表明,VAST视觉与语义图像搜索系统的检索准确率较常见的图像搜索引擎有所提高,检索性能方面很好的满足了用户的需求。