论文部分内容阅读
摘要:随着信息技术的飞速发展,需要处理的数据量呈级数增长,可视化技术在数据分析和挖掘过程中发挥着越来越重要的作用。与此同时,可视化技术种类也日益增多,且它的应用范围也不断扩大。各种可视化技术都有其独特优势和适用范围。可视化技术的推广及深入应用亟需对可视化技术进行有效的评价,通过查阅文献资料可以发现,目前对可视化技术的评测具有很大的局限性,因为它只集中在对具体可视化系统的评价,且受人的主观性影响较大,往往导致评价效果不佳。因此,只有对可视化技术本身进行客观评价,并建立相应的量化评测模型,才能准确的对可视化技术的运用效果进行评价并指导可视化技术的正确运用。本文对可视化技术进行了分类,选择像素可视化技术进行了深入细致的分析研究,并针对像素可视化技术提出了数据属性度、数据密度、数据跨度、数据互异度、数据可视总量等评测指标,建立了量化评测模型PVEM。最后在windows系统环境下设计实现。主要研究工作体现在:1、对传统的像素可视化技术提出了改进方法,在像素点排列策略上,提出让像素点按Peano曲线的运动轨迹排列,在属性子窗口的排列上,使得各维属性排列成有序序列,让其属性维的相似度最小。2、对像素可视化技术进行深入研究,抽取了决定其可视化效果的6个项指标。按其重要性的不同,利用连环比率法赋予其不同的权重,建立了量化评测模型PVEM。3、设计并实现了PVEMSystem系统,包括像素可视化模块、可视化量化评测模块和PVEM验证模块。其中像素可视化模块用来对数据集进行像素可视化;量化评测模块对影响可视化效果的各因素进行分析,从中抽取了6个单项指标,并对其得分进行综合归纳得出一个总分,用总分的大小来体现可视化效果的优劣。验证模块对本文所提出的像素技术量化评测模型进行了实验验证。基于像素的可视化技术支持对海量数据的可视化,对子窗口形状、属性排列方法、像素排列方法的正确选择有助于更容易的发现数据集中隐含的依赖、关联、聚类等逻辑关系。量化评测模型就是对具体的每次可视化效果的定量性评价,用一个量值体现数据集可视化效果。