【摘 要】
:
随着大数据时代的到来,聚类作为数据挖掘和人工智能领域上的重要分析技术,得到了广泛地发展和应用。子空间聚类算法可以有效处理高维数据,同时显著提高聚类正确率,因此具有巨大研究价值和广泛应用前景。大多数现有的聚类方法会要求向量形式的输入数据,对于如图像这种非向量数据,强制进行向量化会损失掉数据内在的结构信息,给聚类结果产生不利影响。传统子空间聚类算法中的离散指示矩阵直接由连续指示矩阵预测得到,造成聚类效
论文部分内容阅读
随着大数据时代的到来,聚类作为数据挖掘和人工智能领域上的重要分析技术,得到了广泛地发展和应用。子空间聚类算法可以有效处理高维数据,同时显著提高聚类正确率,因此具有巨大研究价值和广泛应用前景。大多数现有的聚类方法会要求向量形式的输入数据,对于如图像这种非向量数据,强制进行向量化会损失掉数据内在的结构信息,给聚类结果产生不利影响。传统子空间聚类算法中的离散指示矩阵直接由连续指示矩阵预测得到,造成聚类效果的不确定性。因此,研究保留数据的空间信息和探究指示矩阵与表示矩阵之间的潜在联系成为本文工作的主要内容,本文的主要工作如下所示:第一,为了解决当前主流的最小二乘回归子空间聚类算法中原始数据的空间信息丢失,采用连续指示矩阵聚类直接预测离散指示矩阵造成聚类效果的不确定性这两个缺陷,本文提出了基于图像投影岭回归和指示矩阵的子空间聚类算法(SCIPRRIM)。该算法采用图像数据矩阵进行聚类,保留了数据的空间信息。对原始数据进行图像投影岭回归操作寻找投影矩阵,并对原始矩阵进行降维,降低了数据的维度。通过表示矩阵和投影矩阵交替优化得到具备准确刻画子空间能力的表示矩阵,同时保留了数据的空间信息。通过表示矩阵构造邻接矩阵,加入连续指示矩阵学习项得到连续指示矩阵,引入转换矩阵,将连续指示矩阵转化为离散指示矩阵,通过连续指示矩阵和离散指示矩阵的交替优化,得到最优的连续指示矩阵,将连续指示矩阵代入K均值聚类,得到聚类结果。实验结果表明SCIPRRIM算法的聚类效果要优于对比算法,从而证实了该算法的有效性。第二,本文在SCIPRRIM算法的基础上,引入流形学习来保证样本数据在表示矩阵上的表示相互接近,提出了基于图像投影岭回归和指示矩阵的非线性子空间聚类算法(NSCIPRRIM)。该算法定义了一个流形邻接矩阵来探究数据的非线性流形空间,通过对表示矩阵,流形空间学习和投影矩阵学习三者进行迭代优化,得到能够准确刻画子空间的表示矩阵,并且保证了表示矩阵的局部光滑性质。根据表示矩阵构造邻接矩阵,引入转换矩阵,将连续指示矩阵替换为离散指示矩阵,将数据的连续指示矩阵,离散指示矩阵进行交替优化,得到最优的连续指示矩阵,将连续指示矩阵进行K均值聚类,得到聚类结果。实验结果表明NSCIPRRIM算法的聚类效果较之SCIPRRIM算法更具优越性。第三,为了加强表示矩阵和指示矩阵之间的联系,本文提出了基于指示矩阵的稀疏子空间聚类算法(SSCIM)。该算法通过构建图像数据的散度矩阵学得图像数据行列方向上的投影矩阵,对图像数据的行列方向同时投影,组成一个新的数据矩阵进行聚类,保留了图像数据的空间信息。该算法解决了表示矩阵学习任务和指示矩阵学习任务分开进行导致聚类效果下降的缺陷,对表示矩阵,连续指示矩阵和离散指示矩阵三者进行交替优化,加强了表示矩阵与指示矩阵之间的联系,最后对交替优化得到的最优表示矩阵构造邻接矩阵,将邻接矩阵代入谱聚类,得到最终的聚类结果。通过对比实验证明了SSCIM算法相对于对比算法的优越性。
其他文献
随着科技的进步和生活质量的提高,不断增加的工业、农业生产活动产生了越来越多的有害环境污染物,这些污染物被排放到水生环境中,从而引起了全世界对环境和健康的严重关注。
艺术生作为一个特殊的高考群体,在文化课学习方面一直有着“时间紧任务重”的双重压力,在英语学习方面压力更大。而英语写作作为当今高考英语中的一个重要组成部分,其重要性不言而喻。利用图式理论,目的是将艺术生记忆中的经验素材积极地运用到英文写作中,从而让他们参与写作,爱上写作,提高成绩,找到自信。本篇文章从当前教学背景入手,利用现代信息技术手段,采用实践法、对比分析法、访谈法等研究方法,简要分析图式理论教
近年来,响应理论因其在生物物理学、纳米物理、凝聚态物理等多方面的广泛应用而引起了人们极大的兴趣。1957年,日本物理学家Ryogo Kubo对响应理论进行了研究,他推导出了系统
“蜡画”听起来可能感觉有点陌生,但其实蜡画的诞生要早于我们熟悉的油画,可以说是西方的一个传统绘画类别。我们知道在蜡画创作过程中,在寻找艺术形式和画意中艰辛之路十分冒险。在蜡画实践创新之路上,笔者在毕业创作中尝试了多种实验性的表现手法。论文中笔者在创作中探索了蜡画的很多技法和风格。在此,期望探索出区别于西方蜡画的艺术形式,关键呈现出意象、朦胧和飘逸的关乎中国美学语境下的“意境”画面。所谓“意境”其实
目的:本研究通过观察Wnt5a过表达对牙囊细胞(DFCs)中与破骨细胞分化密切相关的OPG、RANKL表达的影响,探讨Wnt5a在牙齿萌出过程中发挥的作用机制。方法:体外分离培养大鼠DFCs,利用Wnt5a过表达慢病毒LV-Wnt5a(2145-1)和阴性对照慢病毒CON283转染DFCs,得到Wnt5a基因过表达的DFCs作为实验组,空载体转染的DFCs和未转染的DFCs作为对照组。CCK-8检
工业生产对我国国民经济的发展起着非常重要的作用,而在机械设备当中有大量的轴承端部零件由于长期旋转摩擦、不正确的装配等原因造成其磨损失效,这些细微的损坏都会影响加工产品的精度和效率,由于这些细微损坏直接更换零件会造成资源的浪费,而零件的修复工作在解决此类问题中显得尤为重要。失效轴承端部零件模型的修复,现有的技术大部分都是在缺损的表面直接进行焊接,存在粗糙、修复不精确的问题。为了解决此类问题,本文以M
现实世界中,许多相互依存的系统组成了完整的复杂系统,如电力网络,交通系统和互联网等。这些系统之间的相互依赖关系确保了这些系统能够成功运作,从而可以具有丰富多样的功能
产酶溶杆菌OH 11(Lysobbacter enzymogenes)是一种由辣椒根际土壤中分离得到的农业革兰氏阴性细菌,该菌能产生多种胞外酶,包括几丁质酶、蛋白酶、纤维素酶、β-1,3-葡聚糖酶
液压振动器是指可将液压能转换成能使工件做周期性振动的机械能的设备,它广泛应用在航天、国防等多种领域。液压振动器目前存在造价成本高、结构复杂、振动频率较低等问题。本文根据现今存在的问题设计了一种转阀配流变频式液压振动器,用转阀实现配流,避免了结构复杂、价格昂贵的问题;同时,通过转阀的旋转快慢来调节振动频率实现变频,也解决了振动频率低的问题。首先根据目前现有的振动器形式确定振动器系统的整体设计方案,对
目的:探讨MicroRNA-214-3p(miR-214-3p)通过β-连环蛋白/TCF-4信号通路对于牙囊细胞(DFCs)成骨分化中的影响。方法:通过双向差速传代法体外分离,培养与提纯牙囊细胞,通过向DFCs中转染miR-214模拟物(mimics)及抑制物(inhibitor)以此上调及下调DFCSs中的miR-214的表达。经成骨诱导7天后,通过qRT-PCR、茜素红染色、免疫蛋白印迹证明m