论文部分内容阅读
信息可视化及大数据可视化的主要研究方向是将大数据时代下的海量信息进行视觉化展示,从而进行进一步的理解和分析。基于对海量的关系型数据进行有效挖掘的目的,本文将数据挖掘领域的聚类分析算法与可视化布局算法相结合,提出了一种新的基于聚类分析算法的海量关系数据可视化方法。首先,针对关系数据集做简单的统计和对比分析,然后通过聚类分析算法对其进行分簇,将得到的各主节点和权重、关系等数据通过力导引算法,写入弹性图布局中,最后基于图可视化的判断标准画出图布局的基本架构。本文选取ECharts和D3.js作为数据可视化的呈现工具,并进行合理的质量评估分析,最终结果在选取10000个数据情况下准确率达到了89%,证明了本文所提出算法的有效性和准确性。文章主要研究工作如下:(1)研究并对比了目前针对海量数据以及关系网络的可视化算法,本文综合美学标准和可视化性能等提出可视化算法的具体划分标准,并对其进行分类;(2)研究对比数据挖掘领域的各类聚类算法。本文通过实证分析,归纳总结出常用聚类算法的性能和适用场景;(3)基于现在算法的局限性,本文结合半监督学习和多关系数据分析的相关理论,提出了一种更适用于关系数据分析的半监督k均值聚类算法;(4)针对FR布局算法的局限性,本文结合生成树算法对关系图进行压缩,进而提出了一种改进的FR布局算法;(5)通过实证分析,测试并对比本文提出的可视化算法对于不同数据量的性能,证明了该可视化算法具有良好的大数据支撑性。