【摘 要】
:
基于空间变换的聚类(CST:Clustering based on Space Transformation)是本文提出的一个新的聚类算法统一框架,其旨在提高单个聚类算法的有效性和普适性,并缓解用户对选择合适聚类算法的困难和选择合适参数的困难。空间变换是将原始的欧氏距离空间通过非线性的映射,建立到一个新的相似度空间。不同于深度学习的特征空间提取,这里的空间变换的映射是显式的,具有可解释性的,更适用
论文部分内容阅读
基于空间变换的聚类(CST:Clustering based on Space Transformation)是本文提出的一个新的聚类算法统一框架,其旨在提高单个聚类算法的有效性和普适性,并缓解用户对选择合适聚类算法的困难和选择合适参数的困难。空间变换是将原始的欧氏距离空间通过非线性的映射,建立到一个新的相似度空间。不同于深度学习的特征空间提取,这里的空间变换的映射是显式的,具有可解释性的,更适用于聚类算法研究。在这个新的相似度空间中,聚类的结构信息更加凸显。对于聚类的有用信息来说,在不减少正面信息的情况下,大大减少负面信息,使其最终所保留的信息更易于被传统的聚类算法所处理,并保持对数据中的离群点和异常点有一定的鲁棒性。本文以谱聚类的使用为例,通过对其输入矩阵的空间变换,来观察聚类的最终效果。本文研究了两类空间变换的范式的有效性和普适性,并试图讨论空间变换对聚类结果的影响因素。为了自动选择合适的空间变换的聚类结果,本文提出使用聚类内部指标。空间变换的关键问题是聚类内部指标的设计,本文首次将聚类的机制问题纳入聚类内部指标的设计,并使这个新的聚类内部指标总体上明显优于现存的聚类内部指标,并能处理非凸数据集、密度分离数据集和含有异常点的弱连接性数据集
其他文献
施工监控是衔接桥梁设计与施工的关键技术环节,其主要任务是对桥梁施工过程中的线形、应力等进行有效的监测和控制,确保在整个施工过程中桥梁结构的变形和内力始终处于安全、
全球气候变化的事实已经被科学界所证实,全球气候变化主要体现在大气CO2浓度升高、气温升高和降水格局变化等方面。氮素是植物生长所需要的第一营养要素。目前关于大气CO2浓
薪酬薪资管理的透明化,是每个企事业单位里面开展生产、管理等活动时不可缺少的关键环节,薪酬管理工作的开展,对于企业的管理决策者和员工自身都有着极为重要的影响。传统的
2008年Hosono研究组首次报道了 La01O1-xFxFeAs超导体,其Tc为26K,引起了人们对于铁基超导体更高超导转变温度的探索。到目前为止,对于铁基超导体的研究已取得了显著的进展,但
新兴经济体外汇市场干预普遍频繁且不透明,因此受到外界格外的关注。中国长期奉行出口导向型发展战略,外界普遍认为中国货币当局在外汇市场上通过购入外汇来抑制本币升值,从
我国东北严寒地区冬季寒冷漫长,早晚温差大,年采暖时间普遍较长,该地区住宅每年用于采暖的能源消耗巨大,且每年新建住宅总量仍相当可观。在当今能源问题日益突出的背景下,进
随着互联网技术的高速发展,利用网络建设信息化系统实现传统的招标流程,已经越来越被公众所认可,招标的流程正从传统的纸质公文办公模式转变为现代信息化模式。本文对电力企
当前,综合考虑海气浪相互作用的耦合模式较单一的海浪模式已成为提高海浪预报精度研究中的热点。随着耦合模式在预报海浪准确性上优势越来越凸显,系统性定量评估耦合模式的海
内生真菌是一类数量庞大的微生物资源,其代谢产物多样性程度高,并且具有抗菌、抗氧化、抗肿瘤、免疫抑制等多种生物活性,是一个寻找天然活性物质的巨大宝库。本论文以抗菌活
随着《中华人民共和国信息公开条例》的实施,政府信息公开工作受到了社会各界的关注,《条例》要求政府要坚持“以公开为常态,以不公开为例外”的原则,将政府信息公布在政府门户网站上。政府门户网站作为一座将政府与公众连接的线上桥梁,拉近了政府与公众之间的距离。然而,政府门户网站上公布出来的信息是否为公众切实需要的,是否具备良好的质量,公众是否满意,不同的人对此有不同的看法。因此,本文对政府门户网站信息透明做