论文部分内容阅读
高维数据可视化(High-Dimensional Data Visualization,简称HDDV)技术已经成为从高维数据获取有用信息的重要途径和有效手段,主要用于高维数据的分析和展示。HDDV在图像识别,生物数据,地震预测和航天遥感等领域正发挥着越来越重要的作用。随着HDDV技术的不断发展,如何抓住高维数据中的有用信息,进一步透过可视化技术实现低维展示,是目前迫切需要解决的问题。这就需要首先借助降维方法对高维数据进行必要的降维处理,然后利用可视化技术最终实现展示以供图形化分析。由于高维数据自身的特点,一方面造成了时空复杂度高的窘境,另一方面它也蕴含了很多人们无法通过观察直接获取的信息。对于处理高维数据的研究,很多工作都集中在降维算法的研究上,特别是流形学习;对于高维数据的展示方面,采用基于几何的可视化技术,即平行坐标法。针对高维数据的可视化,本文主要工作有以下几个方面:1.进行了线性和非线性降维方法的相关研究。并针对流形学习的降维方法提出了一些改进,主要是从有效提取高维数据的本征维度、提高分类效率、实现增量学习、降低噪声的干扰等方面着手研究,同时给出相应的实验论证。2.针对平行坐标的可视化技术,可以考虑结合维度限制或者降维处理过程,以弥补数据过于密集造成的可视效果不足。3.针对商业智能中的数据挖掘过程,增加一个初步可视化过程,本文给出了基于维度限制的初步可视化方法和一种基于Isomap和极大似然估计的平行坐标(PareallelCoordinates based on Isomap and MLE,简称PCIM)初步可视化方法,为最终的数据挖掘提供良好的反馈作用。建立在标准数据集上的实验结果表明,对比Isomap、LLE和LTSA降维算法,本文的改进降维算法确实能弥补其一些方面的不足。本文以商业智能中的两种数据为例,给出了详细的初步可视化实现流程,取得了较好的结果。