论文部分内容阅读
多维数据可视化技术是处理高维数据集合的有效手段,可视化技术将高维数据集合转化为直观的图形信息进行展示,用户可以借助可视化结果分析高维数据集合,发现潜在的有用信息。随着科学技术的发展,高维数据的规模和复杂性不断提高,现有的多维可视化技术在高维数据展示上已经不能满足用户的需求。因此,对多维可视化技术的研究具有重要意义。本文针对两种多维可视化技术,即平行坐标可视化和散点图可视化在高维数据展示上存在的不足进行分析和改进,分别提出了对应的改进可视化方法,以加强高维数据可视化效果。本文主要研究内容如下:(1)研究了多维数据可视化技术,并对平行坐标可视化和散点图可视化的基本原理和优缺点进行了详细介绍。(2)提出了一种基于维度重排和聚类的平行坐标可视化方法。该方法首先提出一种新的维度重排算法分析维度之间关系,优化维度顺序,并把这种维度重排算法和聚类算法相结合进行平行坐标可视化。除此之外,针对原始可视化方法标签包含信息少的缺点,该方法提出了新的标签显示方法,采用维度之间相似性大小和维度名称作为新标签显示。最后为了增强可视化结果的交互性,该方法融合了缩放技术。实验结果表明该可视化方法能更好的展示数据信息和维度信息,满足用户对高维数据的理解需求,标签的改进和交互技术的设计可以更方便用户分析数据集合。(3)提出了一种基于抽样的快速散点图可视化方法。在该方法运用了抽样技术,即使用抽样技术选取代表性数据集,以此来进行降维、聚类处理,最后利用散点图显示结果。针对散点图可视化效果单一的缺点,该方法提出了多视图协同可视化。最后为了优化维度之间关系,提出了一种新的重排算法。实验结果表明该方法缩短了可视化时间,效率得到了提高,而且可以多角度展示数据集合,同时可以对维度关系进行分析,可视化效果更有效的帮助用户进行数据集的理解。