【摘 要】
:
聚类集成算法主要由两个步骤实现:通过基础聚类器产生基础聚类成员;通过共识函数(集成策略)集成基础聚类成员。在数据处理方面,聚类集成较传统聚类效果显著,因此聚类集成已经逐渐成为无监督学习领域的热点研究。目前对聚类集成的研究主要集中在集成策略上,而对基础聚类成员的度量和优化的研究较少。本研究基于信息熵理论,提出了一种基础聚类成员的质量度量方法。并在对基础聚类成员质量量化的基础上,提出了一种新型的聚类集
论文部分内容阅读
聚类集成算法主要由两个步骤实现:通过基础聚类器产生基础聚类成员;通过共识函数(集成策略)集成基础聚类成员。在数据处理方面,聚类集成较传统聚类效果显著,因此聚类集成已经逐渐成为无监督学习领域的热点研究。目前对聚类集成的研究主要集中在集成策略上,而对基础聚类成员的度量和优化的研究较少。本研究基于信息熵理论,提出了一种基础聚类成员的质量度量方法。并在对基础聚类成员质量量化的基础上,提出了一种新型的聚类集成算法框架以及三种基础聚类成员过滤算法。具体研究工作包括:(1)基于信息熵理论,使用信息熵对基础聚类中各类簇进行不确定性度量。结合互信息理论得出基础聚类成员相对基础聚类集合(成员集合)的平均类簇不确定性,并定义为基础聚类成员质量权重,记作类簇平均熵。(2)扩展现有聚类集成的两步算法框架,引入基础聚类预处理步骤。分别结合两支决策(三支决策的一种特殊表达)、三支决策以及序贯三支策略进行基础聚类预处理(进一步筛选基础聚类)。(3)按照上述三步框架,构建基于两支决策的基础聚类过滤机制(2BIA)和基于三支决策的两种基础聚类过滤机制(BCF3WD、BCFS3WD)算法模型。具体来说,在2BIA中,若基砌聚类成员质量度量小于预设阈值ξ,则删除该成员,并添加新成员以保持成员集合基数不变。在BCF3WD中,若基础聚类成员质量度量小于预设阈值α,那么删除该成员;若成员质量度量大于预设阈值β,则保留该成员;若成员量度量大于α且小于>夕,则重新计算该成员质量。类似BCF3WD,在BCFS3WD中,首先进行三支决策。其次,改变阈值α夕重新三支决策。这三种机制都会重复执行,直至达到停止条件为止。(4)对比实验表明,三种过滤算法都能有效提高聚类集成性能。对于复杂数据集,三种算法过滤效果明显,且序贯三支方法较其余两种算法时间消耗更小。
其他文献
自从1958年MM理论诞生以来,资本结构与企业绩效关系问题成为财务管理和企业治理研究的热点问题。企业的融资决策结果直接影响到企业的资本结构,进而影响企业的经营决策、治理效率,最终影响企业绩效。电信业作为我国国民经济的重要支柱型产业,具有资金密集性、成本沉淀性和自然垄断性等特点,对其他产业的信息传递和组织效率提升方面有着重要的作用。目前通信技术发展已进入5G时代,但近些年来我国电信企业面临着诸多挑战
摘要:中等职业教育肩负着为社会培养基层劳动者的任务,必须把“三理”教育中的伦理、心理和生理教育有机统一在素质教学活动的各个环节中,以“三理”教育作为载体,提高中职生的整体素质水平。 关键词:三理教育;伦理教育;心理教育;创新素质 由于种种因素的影响,中等职业学校学生的综合素质相对要差一些,加强素质教育是这些学校的首要任务。“三理”教育是目前我国主力倡导的提高国民综合素质的法宝,其主要是从伦
21世纪是一个科技飞速发展、充满竞争的时代。幼儿是未来的建设者,他们具有天生的好奇心与创造力,对周围的世界充满着惊奇。新《纲要》强调科学教育的关键是培养幼儿的科学探
应用现代时间序列分析方法和白噪声估计理论,基于线性最小方差意义下按标量加权最优信息融合准则,对于带白色和有色观测噪声的多传感器单通道系统,提出了分布式融合白噪声反卷积
随着水声行业对水声设备在海水中长期使用过程中高可靠性的要求,对水声设备上各组件在海水中使用寿命的研究变得十分重要。根据近年来国内相关学者利用热海水加速老化试验、
义务教育阶段的中小学教育系统中,女工即女教师,在教职工队伍中占有相当大的比重,因此,做好女教工工作应该是中小学工套工作的一个重要方面。学校工会要进一步发挥桥梁和纽带作用
从解决模糊系统的“规则爆炸”问题出发,本文首先给出广义递阶Mamdani模糊系统的定义,然后证明其与具有中间变量的广义Mamdani模糊系统等价,并借助方形分片线性函数构造性的证明
无线传感器网络由大量传感器节点构成,因此对网络整体造价特别敏感.优化设计传感器网络构成,可以在满足监测精度的同时最小化网络造价.本文提出了一种GA和SA结合的改进GASA优化设
作为典型的远距离输电系统,四川电网存在严重的暂态稳定问题.为提高其稳定性,首先运用非线性鲁棒控制理论建立了含外部干扰的统一潮流控制器(Unified Power Flow Controller)