论文部分内容阅读
随着数字媒体技术和社交网络的发展与普及,越来越多的网络信息以包含多种模态数据的多媒体文档的形式出现。传统的文档检索已经不能满足人们的需求,如何有效的从这些海量多媒体文档中快速、准确的检索到用户需求的信息是高效利用互联网资源迫切需要解决的问题。本文首先对现有的多媒体信息检索的方法进行了研究,在其基础上,针对利用单一模态对多媒体文档进行检索时表达的语义含混不清具有歧义的问题,提出了一种多模态融合中采用线性加权和的方法对多媒体文档进行检索。其中文本采取基于Lucene的全文检索,图像利用基于内容的纹理、颜色等检索的LIRE。权重的分配按照各个模态检索结果的正确率做比例来划分,此方法经实验验证检索准确率较高。本文提出的另外一个方法是利用融合的词袋方法BOW和特征袋方法BOF对多媒体文档进行检索。其中应用的词袋方法是经过对单词分类后的改进的词袋方法,改进的方法大大降低了码书的尺寸,使得检索效率更高。实验证明,融合的BOW和BOF综合考虑了文本和图像对多媒体文档检索的影响,效率要高于只使用BOW或BOF对多媒体文档的检索。