论文部分内容阅读
随着Web信息的爆炸性增长,如何从Web上及时有效地查找到真正所需要的信息,已经成为研究者面临的难题。Web信息检索在这种背景下应运而生并得到迅速发展。越来越多的应用要求返回给用户的检索结果不仅是内容相关的,还必须是与用户当前或提供的地理位置相关的。位置相关的Web搜索能提高搜索结果的准确性,在很多方面具有广泛的应用。 根据查询的用户接口和不同的应用需求,位置相关的Web搜索包括两类典型应用:基于文本的和基于图像的。基于文本的搜索主要是“找出某一位置内或附近的对象”。查询中包括确定的位置信息,该位置信息可以用简单的方式进行描述,如利用文字或者地理坐标等。基于图像的搜索主要是判断“在哪里”,即判断用户感兴趣的对象所在的位置,当用户不能用简单的文字描述该位置或者不知道如何描述的时候,用移动设备拍摄图像并发送搜索请求,服务器通过在图像数据库中进行图像匹配,返回给用户相关的网页或者信息。 本文针对以上两类位置相关的Web搜索进行了研究,分析了在检索过程中各自面临的难点问题,提出了相应的解决策略,以及相关的索引结构和图像匹配算法,给出了系统级解决方案,并构造了系统原型,验证了所提出的策略和相关技术的有效性。 本文的主要研究内容及其创新点如下: 1.提出了一种新的混合索引结构,解决了已有基于文本的位置相关Web搜索的索引所面临的问题。已有的方式是将用户输入的地理词看作普通的文本关键字,利用关键词匹配的方式检索出包含这个词的网页。这种方法的缺陷是:忽略了涉及到某个地方但是没有包含其地名的网页,忽略了同名或者别名的现象,以及忽略了基本的空间关系和地理相关性。所提出的混合索引结构克服了上述缺陷,并提高了检索的效率。理论上的代价