基于MapReduce的FCM聚类集成算法

来源 :计算机应用研究 | 被引量 : 3次 | 上传用户:hao8035
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模糊C-均值(FCM)聚类集成算法是一种利用集成思想提高聚类质量的方法。针对FCM聚类集成算法随着数据量的增加时间复杂度过高的问题,提出一种基于MapReduce框架的并行FCM聚类集成算法。首先利用多组随机的初始聚类中心分别进行聚类来获取具有差异化的聚类成员;然后通过建立聚类成员簇间OVERLAP矩阵来寻找逻辑等价簇,统一所有聚类成员中的簇标记;最后利用投票法共享聚类成员中数据对象的聚类情况得出最终的聚类结果。实验结果表明,该算法具有良好的精确度、加速比和扩展性,具有处理较大规模数据集的能力。
其他文献
研究多属性社交网络节点重要性排序问题。已有的多属性排序法基于主观赋权,在研究者对某数据集或者是某社交领域并不是很熟悉的情况下,主观赋权容易出现偏差。针对这点提出在对
针对微博热点话题检测使用主题模型只能提取出无序话题词组合的问题,提出一种结合词激活力模型与主题模型各自优点的微博热点话题检测方法及话题关键词的计算方法。使用传统
针对已有的动态优化算法求解高维动态背包问题(DKP)难以获得高质量的可行解,且跟踪环境速度慢,提出了一种修补二进制差分进化算法(BDE/R)用于求解高维DKP。在BDE/R设计中,一种随机