论文部分内容阅读
当前海量数据被收集并存储,从这些数据中挖掘出有用的知识成了迫切需求。然而面对海量复杂数据,传统数据分析方法显得有些力不从心。可视分析,是一门借助交互可视化界面进行分析推理的学科,为数据分析提供了全新的手段,已经成为目前最新的研究热点。本文研究实现基于组件的、多视图协同的可视分析系统,用于探索分析复杂的时空数据,挖掘其中隐藏的空间模式、时间模式及多维属性模式。杭州房地产数据,是一种典型的时空数据,包括楼盘的空间分布情况、均价和销量变化规律、楼盘的属性相关性等复杂特性。本文以该数据为例进行分析研究,以可视化的方式,提供综合有效的、可交互的分析方法。系统研究实现四个可视分析组件:GeoMap、PCP、TimeSeries和Treemap。GeoMap,地图组件,提供空间视图;PCP,平行坐标组件,提供多维视图;TimeSeries,时间序列组件,提供时间视图;Treemap组件,提供综合视图。在实现上,每个组件平滑地融合了聚类、交互、颜色配置等多种方式,以增强单个组件的可视分析能力。GeoMap组件,基于瓦片金字塔模型构造,另外为了解决视觉过载问题,引入地图标记聚类算法。PCP组件,用于可视化四个维度以上的高维属性数据,组件对传统定义的平行坐标进行可视化能力增强,实现数据子集刷取、直方图集成、坐标轴控制以及颜色映射等功能。TimeSeries组件,以Overview+Detail方式实现双尺度交互导航,并支持多个粒度的时间聚集和多种图表类型。Treemap组件,结合四种布局算法,以可视化参数可交互配置的方式实现,该组件能综合反映时空数据中的多维和空间成分。为了避免各个组件功能上相互孤立,本文利用内审观察者协同机制,实现组件之间自动连接。这种协同机制实现的多视图协同,相对传统的方式,在协同上具有高效性和可扩展性。利用多视图协同连接,各个组件相互补充,系统整体综合分析能力大大增强。