论文部分内容阅读
聚类分析在社会科学研究方面有很大的应用价值。聚类分析可以把研究对象按样本或者指标在性质上的亲密度分解成多个类,使类内对象相似性较高,类间对象相似性较低。通过聚类分析,可以识别数据集的分布结构以及数据之间的相似程度。在社会问题决策过程中,我们经常会遇到这样的问题:不同的区域、行业,不同层次收入的人群,在制定决策时不能一概而论,而是需要分类决策。研究分类数据,我们经常会用聚类分析方法,进行数据结构识别和相似性度量,以便可以正确而高效地解决问题。聚类分析算法的用途范围非常之广。在商务上,市场研究者可以利用聚类在许多的消费者群体数据中分类出不同的消费群体,并用不同的消费模式来描述不同的消费群体的特征;在社会经济发展中,可以对区域经济与社会发展水平进行聚类分析,并对全国区域经济进行整体分类评价;在生物上,可以对各种植物或者各种动物种类进行聚类分类,对各种基因或者各种蛋白质进行聚类分类,然后得到对各种种群组成的结构更加清晰的理解和认识。聚类算法可以独立地得到数据分布的情况,观察每个分类簇的特征,并对这些特征的节点进行再分析。历经多年的发展,我们国家各地区普通高教发展非常之迅速,各地区高等院校也为国家、社会输送了大量的高学历毕业生。然而因为我们国家不同的地区呈现出不均衡的经济发展状况,并且各个地区与生俱来的高校布局结构导致我们国家每个地区高教发展起跑线不在同一条水平线上,所以我国31个地区的高教水平有着某些程度上的差别。本文利用聚类分析方法对我们国家区域性高教发展相关的数据资料进行分类整理,发掘各地区市高教前进发展过程中的差异、规律、结构与特点,这种分析方法对政府的决策和管理各部室、各地区市在整体上掌控我们国家普通高教的前进进程和发展水平,对不同类的地区分析原因,对不同类的地区制定不同的政策,以便更全面整体的指引我们国家普通高等教育的健康快速发展。本文首先介绍聚类分析算法相关的主要理论,主要介绍各种聚类算法的基本思想以及适用的数据集类型,探讨根据样本或指标数据如何选择合理的聚类算法,以我国各地区普通高等教育的数据集为例,利用MATLAB软件和SPSS软件实现对数据集的聚类分析过程。根据算法生成的结果,明确各地区普通高等教育的差异与特点,根据各地区政治、经济、文化、地理以及人文特点,建议有针对性的制定相关政策,各地区发展差异不足时实施扩大差异的发展战略,差异过大时实施平衡性的发展战略以调整性促进我国高教事业的整体健康发展,同时体现出聚类分析理论在社会政治、经济领域中的实用价值。