论文部分内容阅读
粗糙集理论是数据挖掘和知识发现领域的一种新型理论。它能够处理不确定、不完全的信息,不需要先验信息,可从数据中获取知识,生成决策规则,得到的知识相对客观。粗糙集合理论凭借其独特的优势而在KDD领域中具有越来越重要的地位。
在基于知识的专家系统中引入数据挖掘技术以解决其存在的知识获取上的不足,已成为当前专家系统的发展方向。因此,围绕粗糙集理论在专家系统知识获取中的应用展开研究具有很大的实际意义。
为提高离散化效率,通过对初始断点集进行精简,将NguyenSH提出的布尔逻辑和粗糙集理论相结合的算法进行了改进,改进后的算法在空间复杂度和时间复杂度上都有较大程度地降低。
从工程应用的角度出发,研究了分层递阶约简算法。先将属性根据采集的难易程度分层,然后逐次约简,得到的分层递阶简约使单层次和单粒度上的问题求解过程转为多种层次和多种粒度上的问题求解过程,从而为合理规划属性采集流程提供有益参考。
为改进存在噪声数据的挖掘,通过建立允许一定误分类率的机制,增强挖掘系统的容噪能力;为反映不同对象具有不同重要性的事实,通过引入反映对象重要程度的加权值,实现了对对象的区分处理。加权粗糙集模型是一种可为对象设置加权值并允许一定误分类率的模型。
为维护知识库性能,通过引入依赖度分析,根据知识依赖度的变化对采集的知识进行评价和分类,进而实现知识过滤。
最后,综合运用上述技术,设计了一种基于粗糙集方法的专家系统框架。