论文部分内容阅读
体数据泛指分布于三维空间且彼此之间存在相互作用的离散数据集合,具有多模态、多维度、多变量、以及数据规模巨大等特点,广泛存在于医学、流体动力学、核物理模拟和气象科学等领域,如CT、海洋流场、核爆和飓风等数据,体数据的处理和分析对医学诊断、海上航行、气象预报和军事应用等具有重要意义。可视化分析是一种以可视化为手段的分析方法,通过将抽象的体数据以形象直观的图形图像方式呈现,使人们可以基于视觉感知直观地探索分析体数据内部隐藏的模式、关系和特点,并进而深刻理解相关物理现象的内在机理和变化规律。当前,体数据可视化及其分析面临严峻挑战:多模态导致数据在获取和应用中存在信息缺失等问题,以致数据完备性和有效性不足;数据规模巨大导致硬件需求高、可视化映射数量多和混叠遮挡现象严重等问题,以致可视化及分析的效率和质量不高;多变量导致体数据内部作用错综复杂,以致难以洞察变量间相互关系。在体数据可视化分析中,体数据处理和视觉分析处于重要地位,本文围绕其中的关键问题展开研究,主要包括体数据插值、分割、时变体数据特征提取与跟踪和多变量体数据关联分析,旨在突破关键技术,为面向体数据的可视化分析应用奠定理论与技术基础。论文主要工作如下:1、针对体数据插值,为了解决反距离权重法参考样本选取缺乏科学指导以及对数据信息的利用不够充分的问题,综合数据点的空间位置信息和体数据的局部统计特性,提出了一种基于统计分布采样的体数据插值方法。首先基于距离影响因子确定插值样本集;然后基于高斯混合模型和贝叶斯信息准则估计插值样本集的概率密度函数,并优化概率密度函数尾部的截断误差;最后通过对概率密度函数采样得到待插值点的估计值。实验结果表明该方法具有较高的精度和鲁棒性。2、针对体数据分割,为了解决现有方法通用性较差且精度和效率难以兼顾的问题,设计了“过分割—聚类”的分割策略,提出了一种基于超体素聚类的体数据混合分割方法。首先提出距离权重和属性权重的概念,优化区域生长准则,并基于区域生长算法对体数据进行过分割生成超体素;然后引入信息扩散估计,优化扩散估计系数并基于信息扩散估计定义统计距离测度;最后基于K均值算法对超体素聚类,实现体数据分割。实验结果表明该方法在保证分割精度的同时具有较高的时间效率。3、针对时变体数据特征提取与跟踪,为了解决现有方法严重依赖于特征定义且通用性较差的问题,将体数据的统计分布作为特征描述,提出了一种基于统计特性相似性匹配的时变体数据特征提取与跟踪方法。针对特征提取,首先基于简单线性迭代聚类方法对体数据分割生成超体素;然后采用混合建模策略建立基于概率密度函数的统计描述与表达;最后交互式选取参考特征并度量其和各超体素的统计距离,通过匹配相似性实现特征提取。针对特征跟踪,采用规则分割策略生成超体素并基于增量学习机制更新统计分布参数,通过逐时刻特征提取实现对特征的跟踪。实验结果表明该方法具有较高的精度和效率,并且能够不依赖于定义对特征进行提取与跟踪。4、针对多变量体数据关联分析,为了探索体数据不同变量之间的内在相互作用关系,提出了一种基于可视化的多变量体数据关联分析方法。首先选择最具有代表性的变量作为参考变量,并基于直方图将所有变量离散化;然后分别基于信息重叠和信息流分析参考变量的成分和变量、成分之间的相互作用,并构建“surprise-influence”图,用户通过交互接口识别变量的代表性成分;最后通过对代表性成分可视化探索变量之间的作用机理,实现关联分析。实验结果验证了该方法的适用性和有效性。