面向司法数据OLAP分析的数据可视化改进

来源 :东南大学 | 被引量 : 0次 | 上传用户:pkutraining
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面对海量的司法数据,使用OLAP多维分析工具可模仿用户多角度多层次的思考模式,为用户组建多维的数据模型,进而支持复杂的分析操作。在众多的多维分析工具中,Saiku作为一种OLAP开源前端框架,融合了多维分析技术和先进的前端可视化技术,已成为是目前比较主流的选择,并在多个领域得到了广泛的应用。然而,现有的Saiku框架在对司法数据进行多维分析与可视化展示的过程中存在着以下问题:其一,Saiku在数据到图形元素映射的过程中,对于几何标记的映射不区分司法数据的类别,容易出现了不合适的图形展示;且Saiku对图形元素中视觉暗示的映射由用户自行决定,系统不加过滤和优化,这导致很多时候展示效果较差。其二,对于连续型标尺的计算,Saiku对分布不同的数据采用相同的方法计算标尺,当分布差异较大时将导致较小的数值难以清楚显示,影响用户观测;且对于分类型标尺的计算,由于Saiku在处理多个维度查询的情况时采用维度的排列组合,会导致比较对象层次不匹配的问题。其三,Saiku在数据可视化的过程缺乏交互,因此无法动态感知用户需求和进行迭代改进。针对现有Saiku框架应用于司法大数据分析过程出现的上述问题,本论文提出一种基于图形语法的改进方法,用于构建图表的数据可视化,并以自底向上的方式组织构建一个数据可视化系统,提升司法数据实际的可视化展示效果。根据功能不同,整个改进系统可分为数据处理模块和可视化模块两大模块。数据的处理模块又包括数据多维分析子模块和数据标度设计子模块,前者任务是利用MySql数据库构建支撑多维分析的星型模型和编码模式文件,将MySql数据库中的数据转换成数据立方体实现用户查询的多维分析功能;后者是数据到图形映射的桥梁,在进行可视化编码前,完成了多维分析结果集的分类工作,从而根据不同数据类型给出了不同的数据标尺。可视化模块包含了图形可视化编码子模块和图形绘制子模块,其中,前者建立数据中一系列数据字段到几何标记和视觉暗示的映射,根据图形语法自底向上的组织方式,分别构建了数据字段到几何标记映射的图形语法和数据字段到视觉暗示映射的图形语法;后者使用分层绘制的方式将图表中的元素组织起来,实现数据到图形的合理映射。最后,论文对系统中各个功能模块进行了检验。在与Saiku多方面的对比实验中得到以下结论:其一,改进方案中通过对数据到几何标记和视觉暗示映射模型的构建,解决了Saiku在数据到图形元素映射中出现的图形展示不合适和展示效果差的问题;其二,对于连续型标尺的计算,改进方案既考虑了数据的分布情况又考虑了适配不同图表大小时标尺的变化情况,而对于分类型标尺的计算,解决了Saiku对比对象层次不匹配的问题;其三,改进方案考虑到用户需求的动态变化,通过反馈用户对几何标记不同的图表的选择,可调整数据到几何标记映射中几何标记的权重,从而实现系统迭代式改进。
其他文献
将5批次不同石屑与南方路机V7机制砂以不同比例进行掺和,对混合样品依据《GB/T 14684-2011建设用砂》进行颗粒级配检测。结果表明:石屑掺量在25%时,混合样品均符合Ⅱ区中砂标
目的优选六味地黄生物制剂最佳醇沉工艺。方法采用正交试验法,以丹皮酚含量、多糖含量及浸膏得率为指标,考察六味地黄生物制剂的药液浓度、醇沉浓度、醇沉时间对醇沉工艺的影
结合国外齿轮倒棱技术,从倒棱的实质及其作用入手,对倒棱的加工方法和倒棱值的确定作了简要的介绍,进而提高对齿轮倒棱技术的认识。
本文探讨了难民在加拿大和乌干达的重新安置和融合的进程,以及所涉问题。它揭示了四个关键领域的积极影响和消极影响:政策制定、伙伴和利益攸关方、支持和确保一体化以及社会
在世界经济一体化进程不断加快的背景下,我国的国内经济水平发展迅速,新时期国家和企业对于人才的要求越来越高.在这种情况下,我国实施了新课程改革,希望通过改革教学方法和
随着我国经济的不断发展,审计行业也在不断进步。然而,日益复杂的经济生活又提高了审计的难度,增加了审计的风险。防范审计风险,就应加强对审计风险的认识,提高防范意识,严格
<正> 一、前言后桥从动螺旋齿轮在加工过程中使用硫化切削油。齿轮表面沾满污油,在通过清洗机时,将废油不断带入,使清洗液含油量逐渐增加。近年来,由于产量增长快,已超过清洗
<正>中国国际工业博览会(简称"中国工博会")是中国最具影响力的国际工业品牌展。2009中国工博会将于11月3日~7日在上海新国际博览中心隆重上演,旗下七大专业展联动,12万m2的超
提出了一种基于无线传感网络的实验室安防系统设计.通过ZigBee实现无线组网,实时收集并记录温度,湿度,烟雾,防盗等传感器的信号,保存至日志数据库以供查询.管理者任何时间都
目的:探讨高血压病社区管理血压达标情况。方法:选取高血压患者100例,均为某社区健康服务中心2014年2月~2015年2月收治,随机分组,就社区常规护理(对照组,n=50)与加大社区管理