论文部分内容阅读
随着互联网技术以及各种数据库应用的快速发展,数据存储以及数据传输过程中所涉及的数据复杂程度已远超过传统的数据,许多现代的应用都要分析和处理一些不可靠、不一致和不准确的数据,数据的不确定性成为此类数据一种固有特征。 XML不仅成为数据表达和数据转换的标准,通过将半结构化数据结构的XML和概率论结合起来的概率XML能够很好的存储和表达这类不确定数据。 概率XML上的一个很重要的操作就是计算查询结果的概率,因此去除那些不满足已知条件(如键约束等)的可能域,得到查询结果在已知条件基础上的条件概率十分必要,将计算查询结果条件概率的过程称之为条件计算。 本文首先介绍了概率XML和条件计算的概念,用键约束作为条件计算的已知条件。然后提出概率XML上条件计算的有效方法,引入可能性冲突,可能域集描述符等概念至概率XML,用可能域集树来有效表达概率XML上符合约束条件的可能域集,利用可能域集树来完成条件计算。本文同时给出构造可能域集树、归一化可能域集树和条件计算的算法以及相应的例子。最后实验验证了所提算法的效率。