分布式聚类相关论文
能源互联网架构下,用户数据传播延迟和电力公司管理规定促使电力数据中心建立在全国各地,电力数据因而天生呈现地理分布式,对此研究了......
工业制造大数据的分析与监测具有重要的战略意义,但基于人工的大数据分析方法灵活性差、准确性难以核实、效率较低,文中采用实时获......
近年来,随着云计算、移动互联网、泛在计算技术在软件行业的飞速发展,“万物皆互联”与“万物皆服务”逐步成熟,各领域的可用服务......
随着城市规模的不断扩张,资源紧张、交通拥堵等社会问题日益严重。为实现城市智能化和可持续发展,建设智慧城市已成为不可逆转的历史......
聚类分析是数据挖掘领域的一项重要研究内容,它在金融、电信、保险业、市场营销、异常检测、网络安全、科学决策等方面具有十分重......
本文中,我们研究了协同聚类,并将相关概念与信息安全中的聚类分析联系起来;在这个问题中,我们关注于纷繁复杂的网络攻击时代中,随......
得益于计算机技术和无线通信技术的发展,机器人网络、无线传感器网络、智能电网、计算机网络以及车联网等的应用越来越广泛,多智能......
相较于传统能源,新能源具有储量大、污染少等优点,近年来得到迅猛发展,但因其分散性、不稳定性等缺点存在消纳困难问题,“三弃”现......
对于大规模的图数据,当前的图聚类算法的时间和空间扩展性较差,且倾向于细粒度的簇.本文提出k层邻接点概念,从而避免单层邻接点导......
随着现代企业的信息化快速发展,信息系统产生的数据量日益增大,从大量的数据中提取有用信息并非易事.K-Dmeam算法是基于K-Means的......
提出了基于分布式聚类的异常入侵检测方法ID—DC,通过对训练集进行分布式聚类产生聚簇模型,采用基于双参考点的标识算法Double—Refe......
为了解决模糊关联规则挖掘算法需要用户事先给定模糊集和相应隶属度函数的问题,提出基于分布式聚类自动生成模糊集及隶属度函数的算......
针对传统机器学习算法存在的问题,研究了在地理分布式情景下的用户负荷特征聚类算法。提出了在单节点集中数据集下生成局部聚类模......
传统的分布式聚类算法设立中心节点来实现聚类过程的控制,这不仅降低了系统可靠性,而且容易出现单点失效问题。提出一种基于P2P网络......
MapReduce作为一种分布式编程模型,被广泛应用于大规模和高维度数据集的处理中。其采用原始Hash函数划分数据,当数据分布不均匀时,......
基于位置服务的移动增强现实以虚实融合的方式呈现用户周围环境.本文采用C/S架构实现基于视觉的移动增强现实系统,解决手机处理速......
随着数据流规模的持续增大,现有基于网格的聚类算法对数据流的聚类效果不好,不能实时发现任意形状的簇,也不能及时删除数据流中的......
针对有向传感器网络DSN(Directional Sensor Networks)中,传感器节点部署数量对目标跟踪精度、网络寿命和能效问题的影响方面,提出......
针对P2P网络的动态性、分布性等特点,提出了一种运用加权改进的K-Wmeans算法对Web服务进行聚类分析的方法。通过对P2P网络中各个节......
针对传统k-均值聚类算法中每个属性聚类作用相同而导致的聚类效果不佳,以及不适宜在传感器网络中使用等问题,在传感器网络中采用粗糙......
基于集成学习的思想,提出一种分布式聚类模型.该模型的分布式处理过程分为2个阶段:先在局部站点局部聚类,然后在全局站点全局聚类.......
大量复杂异构数据分布于各个网络站点上,分布式聚类是海量数据处理的一个重要应用。该文针对基于密度的分布式聚类(DBDC)算法提出一种......
针对P2P网络的分布式特征,提出一种可扩展的分布式社区发现方法PDC,采用节点Power值度量社区结构,选择中心节点。仿真实验结果证明,与F......
针对垂直划分的分布式数据库提出了一种基于隐私保护的分布式聚类算法PPDC-VP,该算法基于K-Means的思想实现分布式聚类,并且聚类过......
为有效提高非球形分布式水平划分数据集的聚类质量,提出了一种分布式约束一致高斯混合模型(DCCGMM)。DCCGMM以高斯混合模型(GMM)作......
随着网络的广泛应用,大量的数据将分布存在.由于网络带宽、站点存储量等一系列限制,分布式聚类分析成为具有挑战性的研究课题.人们......
针对分布式数据流聚类算法存在的聚类质量不高、通信代价大的问题,提出了密度和代表点聚类思想相结合的分布式数据流聚类算法。该......
由于信息化的不断拓展,一方面数据广泛分布于不同的部门,各部门需求在不泄漏自身数据的情况下进行充分合作;另一方面由于数据量的......
时空复杂度较高以及物理机器内存不足,会导致传统聚类算法不能有效地分析处理大规模数据网络。针对该问题,在MapReduce分布式模型的......
提出了一种新的表达数据集的方法———特征向量,它通过坐标和密度描述了某一密集空间,以较少的数据量反映站点数据的分布特性。在......
信息化技术的发展,数据挖掘技术为人们提取网络资料提供了便利。本文结合SOA架构及web技术,提出了基于SOA架构的分布式聚类算法的Web......
为了解决集中式聚类算法不能处理海量大数据的问题,提出基于Fisher判别确定置信半径的分布式聚类算法.应用网络上各个节点的计算、存......
基于劳动力市场系列指标,设计劳动力密度估计、数据块耦合、数据聚簇中心提取和分布式归集等过程,对新疆华凌贸易市场进行劳动力资......
对基于密度的分布式聚类算法DBDC进行改进,提出了一种基于密度的分布式隐私保护聚类算法DBPPDC。在由局部模型确定全局模型时,通过相......
移动互联网的发展使得移动音乐越来越流行,用户量和用户产生的数据也越来越大。面对如此庞大的数据量,用户选择将会变得十分茫然,......
传统聚类分析是一种无监督学习方法,聚类过程仅仅使用了无标记数据,忽略了数据集自然存在的各种先验信息。然而,半监督聚类则在使用无......
针对水平划分的分布式数据库提出了一种基于隐私保护的分布式聚类算法PPDK-Means,该算法基于K-Means的思想实现分布式聚类,并且聚......
随着互联网的高速发展,电子商务网站每天需要处理的日志信息多达几terabyte。如何廉价并且高效地去除日志中的暂时无用信息、提取......
针对分布式Canopy-Kmeans算法中Canopy选取的随机性问题,采用"最小最大原则"对该算法进行了改进,避免了Cannopy选取的盲目性;采用M......
针对CURE算法处理大量数据时聚类速度较慢的问题,一方面采用网格聚类方法对初始聚类对象进行网格预聚类处理,缩短初始化族聚类时间......
电力负荷模式分类已经变得越来越受到重视,其在负荷预测,异常用电检测等许多方面均有重要的应用,目前电力用户的负荷模式分类主要......
传统的集中式聚类是对集中存放在单个站点的数据集进行聚类,但不能解决数据分布存储环境下的聚类问题,而分布式聚类算法是从分布存储......
对基于密度的分布式聚类算法DBDC(density based distributed clustering)进行改进,提出了一种基于密度的分布式聚类算法DBDC*.该......
图作为一种常用的数据结构,由结点及其之间的连接边组成,目前已成为各种复杂对象及其之间联系的建模工具。在电子商务网站中,客户......
随着计算机和存储技术的快速发展,人们已经积累了大量的历史数据,迫切需要将这些历史数据转化为知识。聚类分析,基于“物以类聚”的朴......
针对分布式聚类算法DBDC存在的不足,提出一种基于中心点及密度的分布式聚类算法DCUCD。将数据分布计算出的虚拟点作为核心对象,核......