论文部分内容阅读
随着信息技术的发展,数据挖掘被越来越多的专家学者重视,并被应用到实际问题的研究和应用中。数据挖掘的效率主要依赖于挖掘方法,聚类作为独立的数据挖掘工具或者作为其他数据挖掘算法(如特征和分类)的预处理步骤,已经成为数据挖掘领域一个非常活跃的研究课题。聚类分析是数据挖掘中的重要分支,它的目的是根据不同对象的不同特征,将它们划分成不同的类。目前,聚类分析已经被应用到众多的领域中去。膜计算是新兴的算法模型,它以生物的细胞为原型,将其结构和功能进行分析和研究,并对此进行了抽象和转化。膜计算具有分布式、不确定性、最大并行计算性等独特特征。膜计算与图灵机有众多的相似之处,它们的计算能力相仿,但膜计算在某些方面更胜一筹,尤其是在并行性和优化问题等方面有很大的优势。脉冲神经膜系统是膜计算的一个重要的分支,该膜系统中的细胞均采用神经元细胞,其思想来源于生物神经系统。基于脉冲神经膜系统的国内外研究现状,目前SN P系统的已有研究成果以理论性研究居多,主要集中在计算的有效性和计算的准确性方面,以及对基于不同生物背景下提出的一些不同种类的脉冲神经膜系统或变体的研究。而对于聚类的实现主要还是依赖一些传统的方法,近几年一些生物计算方法开始用于解决聚类问题形成一种基于生物计算方法新的聚类思想,而膜计算与聚类问题的结合就是其中一项很重要的研究方向,本文正是在这种思路的引导下提出了用一种特殊的膜系统(脉冲神经膜系统)解决聚类问题,形成一种基于SN P系统的新型聚类方法。本文主要利用脉冲神经膜系统的并行性,不确定性来实现该系统在聚类问题中的算法研究,首先将SN P系统与粒子群聚类算法相结合,构建了一个基于SN P系统的粒子群聚类算法,利用粒子群算法的迭代的随机性即其充分的全局寻优能力找出优化后的初始聚类中心,然后由K-means算法进行初始聚类中心已知情况下的迭代聚类,并通过UCI数据集中的三种不同维度空间的典型数据进行仿真实验,并和标准PSO算法和PSO-KM算法进行准确性和时间复发性的比较,得出本文设计的SNPSOKM算法具有较高的准确率和相对较少的执行时间。本文中提出了带有膜计算特点的基于SN P系统的凝聚层次聚类模型,它在K-凝聚层次聚类模型的基础上融合了脉冲神经膜系统的众多特点,对传统的算法进行了改进和提升,实现了原有的传统算法无法达到的计算能力。社交网络交友平台是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助用户选择良好的朋友,同时建立好与彼此之间的关系。社交网站的推荐系统为用户推荐朋友,自动完成朋友筛选和推荐的过程,满足用户的交友需求,推荐基于:用户彼此之间共同拥有的朋友,共同拥有的朋友的数量以及其他的隐性关系。在本文中,朋友推荐问题被抽象成层次聚类的问题,因此就能够使用脉冲神经膜系统来实现,它的意思在于能够推动朋友之间的联系与沟通,在现实中的众多应用系统中有着重要的应用。