论文部分内容阅读
随着科学技术的发展与高精尖仪器的更新,科学领域中所能观测到的数据呈爆炸式增长且种类繁多,如何高效的存取与管理科学数据已经成为科学家亟待解决的问题。传统的关系型数据库由于其表结构的数据模型无法很好的支持科学数据的阵列模型,同时还会在两种数据结构的转换等方面带来极大的额外开销。为解决传统关系型数据库的不足,阵列数据库应运而生。它不仅为科学数据的存储管理提供了一种更为高效的选择方案,而且还为各领域科学家提高了分析处理科学数据的效率。同时,索引在传统数据库研究领域中是最为关键的技术之一,是一种快速查询数据的有效手段。但是由于阵列数据库的存储方式与传统关系型数据库的表结构存储方式存在差异,且单一类型的索引树形结构无法完全支持科学数据的多种复杂分析型查询类型与多种数据组织方式。因此,本文提出将通用索引框架引入阵列数据库,不仅能满足科学数据对于索引的需求,还能为各领域科学家提供高性能的复杂分析型查询服务。本文通过对阵列数据库的数据存储结构进行分析,针对其在复杂分析型查询中表现的性能瓶颈,设计并实现了一种新的索引方案——通用索引框架。该结构针对阵列数据库对科学数据在复杂分析型查询中存在的不足,通过根据不同种类的查询语句灵活构建多种索引结构的方式,获得阵列数据库系统分析处理性能的大幅度提高。本文主要研究内容为:(1)研究阵列数据库的数据模型以及存储方式;(2)在阵列数据库中构建通用索引框架调用接口;(3)在阵列数据库中基于通用索引框架构建树形索引结构;(4)通过Proxmox VE云计算平台与真实实验环境,评测通用索引框架在阵列数据库中的性能表现。