论文部分内容阅读
随着数据库应用的普及,人们正逐步陷入“数据丰富,知识贫乏”的尴尬境地。而近年来互联网的发展与快速发展,使得人类第一次真正体会到了数据海洋,无边无际。面对如此巨大的数据资源,人们迫切需要一种新技术和自动工具,以便能够利用智能技术帮助我们将这巨大数据资源转换为有用的知识与信息资源,从而可以帮助我们科学的进行各项决策。
知识发现就是从大量的数据中抽取以前未知并具有潜在可用的模式,数据挖掘则是组成知识发现的重要环节。如何从大规模的数据中发掘深层次的知识和信息,而不仅仅是数据表面的信息,已经成为众多领域的研究热点。
当前,材料科学与技术的发展日新月异,新材料、新技术、新工艺和新方法层出不穷。随之而来,材料信息的数据量和复杂性大大提高。如何高效管理、存储不同类型的材料科学数据,如何最大限度地从中挖掘有价值的信息,如何最大限度地实现材料信息的资源共享和知识创新等,都是摆在材料研究工作者面前的一系列难题。信息技术和计算机网络技术的飞速发展为以上问题的解决提供了可能性,将材料科学和信息技术结合起来服务于材料科学研究,一门新兴的学科——材料信息学正在蓬勃发展。材料信息学是材料科学和信息科学与技术相互交叉渗透而形成的交叉学科、边缘学科。
数据挖掘(Datamining,简称DM)作为20世纪未刚刚兴起的数据智能分析技术,由于其所具有的广阔应用前景而备受关注。作为数据库与数据仓库研究与应用中的一个新兴的富有前途领域,数据挖掘——常常也被称为数据库知识发现(KnowledgeDiscoveryfromDatabase,简称KDD),它可以从数据库,或数据仓库,以及其它各种数据库的大量各种类型数据中,自动抽取或发现出有用的模式知识。
聚类是数据挖掘领域中的一个重要分支,正逐步运用在商业、地质勘探、图像处理等领域。因为它不仅可以作为其他算法的预处理,也可以作为独立的算法加以使用。它不需要预先的类标记,可在数据集上直接使用。
本算法把k-means聚类算法应用在材料信息中,对材料信息数据库进行挖掘,找出不同的材料群及其各自的特点,进行材料细分,以利于指定相应的营销手段,提高客户的满意度和忠诚度,从而留住老客户,吸引新客户,使企业在竞争中利于不败之地。算法无论在理论上还是在实践上都有一定的指导意义。