面向自治数据库的统计信息管理技术研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:NSWDAR
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息和互联网技术的迅猛发展导致数据库系统的复杂性和管理成本日益增加。为此,众多研究者提出了自治数据库概念,以实现数据库系统自我管理为目标,主要包括自动化索引/物化视图/表分区推荐和统计信息推荐与维护等。其中统计信息具有强时效性,对数据变化敏感,又是优化器选择最优查询计划的关键性因素,其精确与否将直接影响到查询处理效率,因此尤其需要自动化管理。 现有自动化统计信息管理技术主要采用后台线程定期对数据扫描或采样的方式,对查询处理影响较大,只能离线或在系统负荷低时进行。这会导致统计信息更新不及时。而少数基于查询反馈的技术又因其收集的反馈信息有限和维护方式的局限性,对查询负荷变化不敏感,且在数据扭曲度偏高时会带来很大的估计误差。为此本文提出自适应统计信息管理框架SASM(Self-Adaptive Statistics Management),通过自学习的方式,使用查询反馈信息实现统计信息的自动推荐、收集和维护,不仅维护的统计信息精确性高,而且对查询处理影响小。 对于已有统计信息管理技术中收集统计信息有限、收集代价高等问题,本文提出基于查询计划特性的统计信息收集,在查询执行过程中,充分利用索引扫描、排序等操作的固有属性来收集相关属性上的数据分布等统计信息,不仅能收集到比单纯查询反馈更详细的统计信息,还提高了统计信息收集的效率。 针对已有基于查询反馈的统计信息自动维护技术中后续调整会破坏已有调整结果、数据扭曲度高时误差较大等不足,本文提出自学习柱状图(Self-Learning Histograms,简称SLH)维护策略,使统计信息能从查询反馈中获知自身错误并通过改正错误不断提高自身精度。SLH通过对查询反馈简单编码来记录历史的查询反馈处理过程,在使用新的查询反馈自我求精时,能感知已有求精结果,并避免重新调整已有结果。当统计信息可用空间不足时,SLH通过空间重整在尽可能不降低自身精度的同时释放部分空间,并通过全局重整策略将空间向对当前查询负荷最有益的方向分配来实现统计信息推荐,克服了已有技术中对查询负荷变化不敏感,不能有效利用空间的不足。
其他文献
随着电网规模的不断增大,为更高要求地实现电力系统运行的可靠性、安全性、稳定性,提出一种以DSP系列芯片为核心变电站故障检测系统,能及时发现变电站隐藏问题,对本系统测频
1开展公益讲座武汉图书馆在全国范围内邀请名家,全省范围内邀请专家,举办以阅读为主题的大型公益讲座200场以上(含电视转播与社区、校园展播),着力通过以下方式文化惠民。1、现场
可重构计算作为一种新的高性能计算解决方案,它具有较高的性能和灵活性,是通用处理器和ASIC的折衷。由于具有较高的灵活性,可重构计算的设计空间巨大,为某个特定的应用领域设
医院会计档案信息管理工作是财务会计的重要部分,我国的医院会计档案信息正朝着规范化,制度化方向发展,但是诸多的原因依旧造成了严重的会计信息档案失真现象。医院会计信息失真
体育教学评价体系的建立是对学校体育教学进行改革的主要内容之一,从某种意义上来讲,评价体系对教学思路、教学质量以及社会对体育人才价值观的确定有着决定性作用。评价体系是
在市场经济条件下,医院存在着各种各样的风险,并最终都表现在财务方面。作为风险管理核心组成部分的财务风险管理也伴随着风险管理全球性运动的兴起而备受世界各国理论界和实务
“vp np 的 np”是汉语中普遍存在的一种句法结构,本文通过分析真实的语言环境中“vp np 的 np”的排歧因素,提出了基于最大熵的该句法结构排歧的方法。文中给出了特征的选择
双语和谐政策,核心寓意是民—汉双语兼通,和谐并育。在语言经济学视野下,一方面让少数民族群体努力学习汉语,更好融入华夏文化发展的洪流;另一方面,也要让少数民族不忘本民族