【摘 要】
:
计算机信息技术快速崛起发展,人们社会生产活动中产生的数据也越来越多。在不断增多的数据中,有一种数值型的多维数据:复杂度高,蕴含的信息量大。如何发现数值型多维数据的内在规律、挖掘更有价值的信息,为后续的研究提供有效的帮助和指导,是一个重要的研究课题。多维数据可视化中的平行坐标可视化技术能够直接、全面展示多维数据对象间的关系,为数据分析提供重要的方法和途径。平行坐标可视化技术在有限平面内对多维数据进行
论文部分内容阅读
计算机信息技术快速崛起发展,人们社会生产活动中产生的数据也越来越多。在不断增多的数据中,有一种数值型的多维数据:复杂度高,蕴含的信息量大。如何发现数值型多维数据的内在规律、挖掘更有价值的信息,为后续的研究提供有效的帮助和指导,是一个重要的研究课题。多维数据可视化中的平行坐标可视化技术能够直接、全面展示多维数据对象间的关系,为数据分析提供重要的方法和途径。平行坐标可视化技术在有限平面内对多维数据进行展示时,平行坐标图中的线条由于空间拥挤,重叠覆盖在一起,造成视觉混乱,数据规律难以发现。降维技术、聚类技术与平行坐标可视化技术相结合,能够很好地解决这个问题。论文结合这3种技术进行研究,实现可视化平台。主要工作有以下3个方面:首先,基于t-SNE,提出改进的t-SNE算法。改进算法中用加权的欧式距离来度量高维空间样本点之间相似度,得到更加精确的样本点相似度;针对算法中损失函数,添加L2正则化作为惩罚项,限制目标函数过拟合,经过多次迭代后获得最佳的目标函数。改进算法和其他降维算法用加州大学欧文分校提供的UCI数据库中的Wine(葡萄酒)数据集进行仿真实验,验证改进算法的降维效果。利用改进的t-SNE算法对数据集做降维处理,然后用平行坐标可视化技术展示,通过与未降维处理的可视化图形实验对比,证明提出的方法能够改善平行坐标可视化效果较差的问题。其次,基于K-means,提出改进的K-means算法。改进算法中用Canopy算法“粗”聚类生成k个Canopy点,作为K-means的初始聚类中心;用加权的欧式距离对数据点进行划分聚类簇,避免传统欧氏距离中的“距离失真”问题。改进的算法与其他聚类算法用加州大学欧文分校提供的UCI数据库中的Iris(鸢尾花)数据集进行仿真实验,验证改进算法的聚类效果。利用改进的K-means算法对降维后的数据集进行处理,再用平行坐标可视化技术展示,通过与未聚类处理的可视化图形实验对比,证明这种方法能够更加直观的发现数据对象之间的联系。最后,以研究生期间参与的武陵山片区茶叶质量安全可视化组追溯大数据平台为基础,利用web前端技术开发多维数据可视化平台,结合国家统计局提供的农产品产量数据集验证了平台不仅适用于低维数据可视化,还满足多维数据可视化。改进的降维算法和聚类算法与平行坐标可视化技术相结合,能够让可视化效果更好,进行数据分析更方便。
其他文献
目前,在国际社会愈加重视动物传染病防疫工作的背景下,动物疫苗的发展和完善面临着新的要求和形势,作为动物防疫工作的关键构成环节以及农产品质量安全的可靠保证手段,受到人
针对服装工业制板中形态较为复杂的小部件常用推板方法容易产生误差的问题,提出了一种新型推板方法--射线作图法,并利用数学的相似形原理对其可靠性进行分析.该方法提高了推
家长是自闭症儿童早期干预选择的主要责任人,在儿童早期干预过程中具有一定的需求。为了更好地提供自闭症儿童早期干预服务,有必要了解家长早期干预选择的历史和现状,研究家长早期干预选择的具体过程,分析影响家长选择的因素,探究家长选择行为的逻辑,还需要分析家长在早期干预选择过程中的需求。本研究以0-8岁的自闭症儿童家长为研究对象,运用量化问卷和质性访谈的方法分析了家长对儿童早期干预的选择和存在的需求。本研究
通过利用定积分的概念探究均值不等式、均方值不等式、柯西(Cauchy)不等式、三角不等式和琴森(Jensen)不等式的极限形式,探究了探究性学习在高等数学教学中的运用.
自1978年我国实行改革开放的政策开始,40多年来,我国社会经济发展水平不断提高,居民人均可支配收入和消费水平持续攀升,随之带动了能够最大限度满足人民日益增长的物质文化和
随着城市化进程的推进,城市化进程中的语言问题成为学者们关注的热点之一。在语言项目的更替中,农业中变化、消亡的词语较为引人注目。本研究以河南省固始县为例,通过梳理文
信息化应用普及愈加便捷的同时,落后的运维理念、粗放的管理方法,使信息服务滞后于发展,阻碍了应用的进步.鉴于此,大连市信息产业局、大连软件行业协会、大连东方之星信息技
<正>狐病毒性肠炎又称为传染性胃肠炎,是由病毒引起的一种急性、热性、高度接触性传染病。该病发病率高,死亡率均在80%~100%。1.病原体。病原体为细小病毒,病毒基因组为单股脱
顾名思义,所谓“教学机智”,是指教师在课堂教学过程中面对千变万化的教学情境,能迅速、准确、灵活、恰当地做出判断、处理,以保证教学任务得以顺利完成的一种综合能力。
英语新课程标准对小学英语“读”的能力目标作了明确的规定。一级目标为:能看图识字,能在指认物体的前提下认读所学词语,能在图片的帮助下读懂简单的小故事。二级目标为:能认读所学词语;能根据拼读的规律读出简单的单词;能读懂教材中简短的要求或指令;能看懂贺卡所表达的简短信息;能借助图片读懂简单的故事或小短文,并养成按照意群阅读的习惯;能正确朗读所学故事或短文。一级目标是儿童识字最基本的目标,通过教师精心细致