论文部分内容阅读
近年来,随着计算机技术的快速发展和Internet的全球化和普及化,对数据库信息的应用受到了人们的诸多重视,数据挖掘技术也因此获得了越来越多的重视和应用。
聚类分析是数据挖掘中的一项非常有用的技术,它可以从大量的数据库中寻找隐含的数据分布规律或模式,它在模式识别、图像处理、数据分析、市场研究等众多领域中发挥着重要的作用。通过对庞大的数据库里的知识进行聚类分析,人们能够从中挖掘出某种有规律的、有价值的东西,以满足人们的需求。
对数据库聚类分析的方法多种多样,有k-means算法、竞争学习CL(Competitive Learning)算法、SOM(Self-Organizing Maps)算法和RPCL(Rival Penalized Competitive Learning)算法等,它们在数据库的聚类分析中都取得了良好的效果。但在现实应用中,对于不同的数据类型或不同的聚类目的,不同的聚类方法会有不同的聚类效果。这时就需要针对特别的数据类型或聚类目的,找出符合需求的聚类方法。
本文在对于RPCI算法和SOM算法进行比较和分析的基础上,针对它们的优点,分别对RPCL和SOM这两种算法进行结合或修改,提出了一种称为RPCL-SOM算法,该算法的主要功能在于能够对数据自动聚类。经过对RPCL-SOM算法的研究,我们把它应用到企业信用评级之中,对我国上市公司自动分为两大类:ST公司类(经营状况差的企业)和非ST公司类(经营状况好的企业)。通过仿真结果看出,该算法取得了良好的分类效果。
在文章中,详细介绍了RPCL-SOM算法及其应用。