论文部分内容阅读
粗集理论是概率论、模糊集理论、证据理论之后的一个新的处理含糊和不确定性数据的数学工具,它不需要任何附加信息或是先验知识,就可以有效的分析和处理不精确、不一致以及不完整的数据,并从中找出我们所需要的隐含的信息,揭示潜在的规律。 属性约简是粗集理论的核心内容之一,它对规则获取和决策支持的结果有直接影响。在保证分类质量和决策能力不变的前提下,经过属性约简,去除数据库中的冗余属性,简化知识表示,使决策系统的运作效率得到提高,方便用户制定最佳决策。属性约简对于知识获取、机器学习、模式识别、模型建立等方面的研究,在实际运用中具有很重要的意义。目前,研究出一种更高效的属性约简算法,降低其时间复杂度和获得较优的属性约简,依然是粗集理论的主要研究方向。 本文介绍了几种基于粗集理论的约简算法,属性重要性、基于区分矩阵、信息熵和蚁群算法的属性约简算法,重点分析现有的基于蚁群算法的属性约简算法。并结合遗传和蚁群算法的优点,提出了一种新的约简算法:基于遗传蚁群算法的属性约简算法,该算法的主要特点是,在遗传算法的选择算子中利用具有偏好信息的多属性排序法对种群里的个体进行选择排序,在适应度函数中引入决策属性对条件属性的重要度,通过遗传算法初始化,为蚂蚁提供初始信息素,同时使用Huffman变长编码,提高了蚁群初始时刻的寻优速度,利用遗传算法隐形并行性的特点,使整体算法实现全局最优。最后通过实验数据和对比分析,对算法进行验证。结果表明该算法是一种有效的求解属性约简的算法,同时它拥有自己的使用范围。