论文部分内容阅读
作为传统二支决策的扩展,三支决策在处理不确定信息的决策问题中起到重要作用。三支决策引入了除接受决策和拒绝决策外的第三种决策,延迟决策。在信息不充分时做出延迟决策,能在很大程度上降低直接做出接受或拒绝决策带来的损失。三支决策对三种决策行为给出了合理的语义解释。其中,划分到正域中的对象表示做出接受决策,划分到负域中的对象表示做出拒绝决策,划分到边界域中的对象表示做出延迟决策。传统的三支决策主要关注二分类问题。但是,多类分类问题在实际应用中更为常见。例如,在医学诊断过程中,医生不仅要诊断患者是否患有某种疾病,还要诊断患者是多类疾病中哪种类型。因此,基于三支决策的多类分类问题引起了学者的广泛关注。然而,基于三支决策处理多类分类问题时,存在两个问题:一是,对于海量高维数据,基于三支决策处理多类分类问题的效率有待提高;二是,基于三支决策处理多类分类问题时,可能存在决策冲突,即对象划分到多个决策类的正域中。针对多类分类决策中的两个重要问题,本文的具体工作如下所示:(1)针对粗糙集中传统可辨识矩阵在构造过程中存在大量冗余元素的局限性,本文改进了构造可辨识矩阵的方法,在计算任意两个对象的区分信息之前,先判别它们在核属性上的取值是否一致,如果不一致则直接将对应元素项置为?,而不必再对其它条件属性进行判断,从而减少了矩阵中的元素项。基于可辨识矩阵,综合考虑每个条件属性占可辨识矩阵中非空元素项的比率与每个属性对区分对象的贡献程度,给出了属性加权重要度的概念。为了进一步减少可辨识矩阵中的冗余元素,提出基于属性加权重要度的改进差别信息树。最后,提出了基于改进差别信息树的属性约简算法,通过实验证实了算法的有效性。(2)针对三支决策处理多类分类问题时的决策冲突,目前主要有两种冲突解决策略:一种策略是决策后解决决策冲突,另一种策略是决策前解决决策冲突。考虑到决策冲突也是一种不确定性,而信息不充分是产生决策冲突的主要原因,因此本文结合序贯的方法,通过逐步添加更详细的信息来解决决策冲突问题,称之为决策过程中解决冲突的方法。本文将该决策冲突解决方法与三种多类分类方法相结合,提出了三种序贯多类三支决策模型,分别定义为“one-versus-rest”模型、“one-versus-one”模型和“one-versus-multiple”模型。其中,“one-versus-rest”模型采取的多类分类策略是将m分类转换为m个二分类,然后对m个二分类分别进行三支决策。“one-versus-one”模型采取的多类分类策略是选择任意两个类构成一个二分类,因此可以形成m(m-1)个二分类。然后对m(m-1)个二分类分别进行三支决策。“one-versus-multiple”模型采取的多类分类策略是直接同时对m分类进行三支决策。三个模型中具有决策冲突的对象都将在下一个粒度层上进行处理,只有可以做出明确决策且没有决策冲突的对象才能被划分到相应的决策类中。最后,本文比较了三种冲突解决策略的性能和所提三种模型的性能,通过实验验证了三种模型的有效性。