论文部分内容阅读
作为数据仓库的一项关键技术,物化视图是加快OLAP查询响应速度,提高决策支持性能的重要手段.由于受到空间开销和视图维护代价等因素的约束,物化数据仓库中所有可能的视图是不可能也是没有必要的,可行的策略是在海量的视图中进行选择性的物化,并加以高效维护.而如何选择适当的视图进行物化,以及如何维护可能是成千上万的物化视图,是数据仓库及OLAP一个非常关键的问题,得到了广泛而深入的研究.
物化视图集的选择和维护,通常是在数据仓库脱机状态下进行的,如选择夜晚停机时间实施.然而随着数据仓库的发展以及应用全球化的趋势,很多因素制约了脱机时间,使系统能够提供“脱机”处理的时间越来越难以保证.于是对不停机条件下物化视图选择和维护算法的研究得到了学术界,企业界普遍的重视.本文就此领域重点对数据仓库在线条件下物化视图的各种相关算法进行了较为深入的研究,主要内容及其取得的成果体现在以下几个方面:
(1)针对物化视图静态选择算法存在的不足,提出一种预处理算法PMVS.该算法充分利用多维数据集中查询稀疏性和数据稀疏性的特点,对静态选择算法的视图搜索空间进行很大程度地约减,有效地降低算法的复杂度,使之基本适合在线运行,从而可以用于实现物化视图集的周期性动态调整.
(2)提出一种基于cache机制的物化视图动态选择算法DMVR.相比于其他动态选择算法都是内存机制简单移植,算法DMVR建立在一个合理的代价模型之上,充分考虑各种影响物化效益的各种因素,可以更好地用于实现物化视图的动态选择和实时调整.
(3)利用动态cache机制的优势,对已有的静态物化集进行有效地动态补充,使其对查询分布的变化和即席查询具有良好的在线适应能力,从而实现物化视图静态选择算法和动态选择算法这两种基于不同机制算法的优势互补.
(4)针对物化视图在线维护的需求,引入机会更新的维护方式,实现系统资源合理的调配和利用,并基于机会更新和延迟更新相结合的策略提出一种在线维护算法ODUA,在保证数据一致性的前提下,通过系统资源合理利用以及更新效率的提高,尽最大可能减少在线维护对系统性能的影响.