论文部分内容阅读
由于计算机科学与技术的发展,特别是计算机网络的发展,人们面对着越来越多的海量信息。尤其是随着数据库的大量应用,在各个行业各个领域都积累了十分丰富的数据,“丰富的数据与贫乏的知识”的问题也日渐突出。近几十年间,知识发现(规则提取、数据挖掘、机器学习等)应运而生,受到人工智能学界的广泛重视,产生了知识发现的各种不同方法。
在知识发现的任务中,人们常常要面临大量数据的处理任务,特别是随着网络信息的不断增长和各个复杂领域如金融数据、医疗诊断、卫星探测等的数据增长,现在面临的处理对象经常达到上百万、千万,计算机的处理能力往往显得不足。并且大量的数据会给知识发现的知识获取方法带来很多困难。所以对数据约简就显得十分必要。目前对数据进行约简主要有两方面:一是减少数据的样本数,这个主要是通过采样技术来实现;二是减少属性或特征,主要利用知识约简和特征选择等方法。
粗糙集理论是继概率论、模糊集理论、证据理论之后的又一个处理不确定性的数学工具。已成为目前知识工程研究领域一种有效的数学工具,粗糙集理论已经在决策与分析、故障诊断、模式识别、数据挖掘、动态目标识别及跟踪等领域取得了很人的成功。
知识约简是知识发现的重要课题,同时也是粗糙集理论的核心问题之一。本文介绍了粗糙集的理论基础,以及粗糙集知识约简的代数表示和信息表示。同时对模糊粗糙集知识约简的信息表示进行了探讨,提出了自己的改进方式。通过实验将粗糙集知识约简技术应用剑对脑部智能活动的探索中,结果证明粗糙集知识约简技术在实际应用中有其优势的同时,也发现了一些对深入了解脑部智能活动有意义的结果。