基于约束性过滤的改进K均值挖掘算法研究

来源 :科技通报 | 被引量 : 0次 | 上传用户:lity1021
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的对数据进行k簇划分过程中,一旦数据过大,在各个簇中心的距离的计算和划分中,需要大量的距离计算操作,算法效率较低。本文提出了一种基于约束性过滤的改进K均值挖掘算法。利用聚类算法中涉及到的可重用的信息,对大量的数据进行校验,删除掉一些冗余信息,保证数据的最优化,克服了k-means聚类算法针对"噪声"和孤立点数据是敏感的缺点。实验证明,提出的初始中心选择方法能够选择出合理的初始聚类中心,改进的k均值算法与传统的k均值聚类算法相比,算法的鲁棒性更强,聚类效果更好。
其他文献
威布尔分布是最广泛应用在可靠性工程寿命分析中的一种分布,本文利用威布尔分布参数估计中传统的图估计法借助于Weibull++6.0对国产东港LL-5型多媒体语言学习系统中的HF9600放大
针对数据库多连接查询优化问题,提出一种基于遗传禁忌算法的数据库多连接查询优化策略。把遗传算法作为查询优化的主框架,禁忌搜索作为遗传算法的变异算子,增加种群多样性,克服遗
根据上海市东电力公司提供的浦东新区2001年1月1日至2003年6月30日每5分钟电力负荷数据和浦东气象台同期每小时气温、气压、风速、风向、湿度、降水、日照时数等气象要素资料
在计算机多分簇任务执行中,由于初始能量有限,需要对网络分簇能耗进行优化分配,提高任务执行效率.提出基于剩余能量相干均衡的网络分簇能耗双阈值分配算法,算法考虑了节点当