论文部分内容阅读
对数据库的查询可以分为精确查询和概率查询两种。当进行精确查询时,查询结果完全符合查询条件,而且结果是确定准确的。但对于某些情况,无法采用精确查询得到正确的结果。比如,当对移动物体的位置信息进行查询时,由于物体在不停地运动中,实际的位置信息的变化往往快于存储在数据库中的位置信息。这样,查询语句从数据库中取得数据时,数据库中的数据往往已经过时了,从而造成查询结果与实际情况的不一致。对于这种情况,由于无法获得查询时刻的精确值,所以通常采用概率查询的办法,即对查询得到的结果赋予一个概率值,用来表示该结果正确的概率。这个概率通过使用相关的概率计算方法计算得到。目前采用的计算模型中,当新的位置更新信息到达时,将立即覆盖上一次保存的位置信息,数据库只能保留最后一次更新的位置信息。这样一来,当使用概率计算方法计算结果的概率值时,由于数据库中没有位置信息的历史记录,自然无法获得位置信息的统计结果,而只能使用通用的概率分布(如均匀分布等),从而降低了对具体查询对象的针对性和查询结果的准确度。另外,使得某些特定的精确查询(如查询过去某个时间点的位置信息)也变得完全不可能,从而减少了可处理的查询的类型。针对这个问题,本文提出一种新的数据的存储方法。该方法改变了目前采用的对位置更新数据的存储方式,当新的位置更新数据到达时,不是用新的数据覆盖旧的数据,而是将新的信息作为一条新的记录插入到相应的信息表中,这样就可以在数据库中保留大量的历史信息记录。对于概率查询,由于保留了历史更新记录,使得到的新的概率分布比使用通用的概率分布具有更强针对性,从而提高了概率查询结果的真实性和可靠性。同时,新模型的实现还同时得到了一个附加的好处——使某些特定的精确查询得到实现,比如,可以得到过去某个时间点的移动物体的位置信息。本文首先对概率数据库进行了简要的介绍,包括概率数据库的研究背景、基本概念、相关模型和研究热点。接下来对移动物体位置查询系统进行概述,给出了系统的模型,并介绍了模型各部分的功能。然后,对系统中最主要的部分——位置信息系统进行了详细介绍,主要包括对移动物体位置信息更新频率的控制策略和对概率查询结果的概率的计算方法。接着,对比已有的数据处理方式,提出一种新的数据处理方式。然后,利用新建立的模型,不但对概率查询进行了改进,而且对某些特定查询的处理进行了描述,同时给出了算法实现。最后,对整篇文章进行总结。