论文部分内容阅读
聚类分析有着十分广泛的应用,一直是模式识别、数据挖掘、图像处理等领域的研究热点之一。现有的大多数聚类算法都隐含假定待分析样本的贡献及其各维特征对聚类的贡献均匀,然而,实际中不同样本和样本的不同维度对聚类过程有着不同的影响。本文针对样本的不均匀贡献,借鉴流形学习中利用数据结构信息的方法,提出了一种拉普拉斯加权聚类算法。随后,对其权值进行优化处理,并将其与半监督聚类的思想结合起来。最后,将隶属度约束及半监督约束形式引入到该算法中,并应用于图像分割。本文主要的创新和研究工作总结如下:(1)在传统C-均值和模糊C-均值的基础上,通过引入能够表示样本邻域信息的权系数矩阵,提出了一种拉普拉斯加权聚类算法,在人工数据集和国际标准数据集上的实验结果验证了所提方法的有效性。(2)对所提出的拉普拉斯加权聚类算法的参数进行优化选择,提出了一种自适应的参数选择方法,该方法能构建更加符合数据集结构信息的权系数矩阵,增强了算法的鲁棒性。(3)在拉普拉斯加权聚类基础之上,结合半监督聚类的思想,提出了一种半监督拉普拉斯加权聚类算法,该算法通过在聚类中使用成对约束,有效地提高了聚类性能。(4)将隶属度约束及半监督约束形式引入到拉普拉斯加权聚类算法中,并应用于图像分割。在人工图像和大脑MRI图像上的实验结果显示,该算法能有效地解决图像中的含噪声等问题,从而取得较好的图像分割结果。