论文部分内容阅读
面对海量的司法数据,使用OLAP多维分析工具可模仿用户多角度多层次的思考模式,为用户组建多维的数据模型,进而支持复杂的分析操作。在众多的多维分析工具中,Saiku作为一种OLAP开源前端框架,融合了多维分析技术和先进的前端可视化技术,已成为是目前比较主流的选择,并在多个领域得到了广泛的应用。然而,现有的Saiku框架在对司法数据进行多维分析与可视化展示的过程中存在着以下问题:其一,Saiku在数据到图形元素映射的过程中,对于几何标记的映射不区分司法数据的类别,容易出现了不合适的图形展示;且Saiku对图形元素中视觉暗示的映射由用户自行决定,系统不加过滤和优化,这导致很多时候展示效果较差。其二,对于连续型标尺的计算,Saiku对分布不同的数据采用相同的方法计算标尺,当分布差异较大时将导致较小的数值难以清楚显示,影响用户观测;且对于分类型标尺的计算,由于Saiku在处理多个维度查询的情况时采用维度的排列组合,会导致比较对象层次不匹配的问题。其三,Saiku在数据可视化的过程缺乏交互,因此无法动态感知用户需求和进行迭代改进。针对现有Saiku框架应用于司法大数据分析过程出现的上述问题,本论文提出一种基于图形语法的改进方法,用于构建图表的数据可视化,并以自底向上的方式组织构建一个数据可视化系统,提升司法数据实际的可视化展示效果。根据功能不同,整个改进系统可分为数据处理模块和可视化模块两大模块。数据的处理模块又包括数据多维分析子模块和数据标度设计子模块,前者任务是利用MySql数据库构建支撑多维分析的星型模型和编码模式文件,将MySql数据库中的数据转换成数据立方体实现用户查询的多维分析功能;后者是数据到图形映射的桥梁,在进行可视化编码前,完成了多维分析结果集的分类工作,从而根据不同数据类型给出了不同的数据标尺。可视化模块包含了图形可视化编码子模块和图形绘制子模块,其中,前者建立数据中一系列数据字段到几何标记和视觉暗示的映射,根据图形语法自底向上的组织方式,分别构建了数据字段到几何标记映射的图形语法和数据字段到视觉暗示映射的图形语法;后者使用分层绘制的方式将图表中的元素组织起来,实现数据到图形的合理映射。最后,论文对系统中各个功能模块进行了检验。在与Saiku多方面的对比实验中得到以下结论:其一,改进方案中通过对数据到几何标记和视觉暗示映射模型的构建,解决了Saiku在数据到图形元素映射中出现的图形展示不合适和展示效果差的问题;其二,对于连续型标尺的计算,改进方案既考虑了数据的分布情况又考虑了适配不同图表大小时标尺的变化情况,而对于分类型标尺的计算,解决了Saiku对比对象层次不匹配的问题;其三,改进方案考虑到用户需求的动态变化,通过反馈用户对几何标记不同的图表的选择,可调整数据到几何标记映射中几何标记的权重,从而实现系统迭代式改进。