基于粗糙集理论的概念格研究

来源 :上海大学 | 被引量 : 0次 | 上传用户:cs_
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
形式概念分析(FCA Formal Concept Analysis)和粗糙集理论(RST Rough SetTheory)是数据分析中两个互补的方法,它们从不同的侧面揭示了数据中隐含的知识。粗糙集理论的基础是等价关系,这种等价关系是由属性所决定的对象间的二元关系,它确定了对象集上的划分。形式概念分析的基础是形式概念(由对象和属性之间的二元关系所确定)以及形式概念之间的有序的层次结构——概念格。从目标和方法论来说,二者有许多相同之处。 近年来,形式概念分析的研究已取得了长足的进步,但依然存在着一些亟待解决的问题。如对连续与混合属性值、区间属性值的处理,具有缺失、不确定和未知属性值的不完备系统的格构建问题等。粗糙集理论适合于处理不确定、不精确和模糊知识。粗糙集中的可辨识矩阵、相似分类、灰粗糙集的灰近似等可以对形式概念分析提供新的方法。因此,研究两种理论之间的关系并把二者结合起来,能使我们更好地分析和理解数据。 基于这样一种思想,本文用粗糙集理论的可辨识矩阵的思想研究了二值形式背景的概念格约简与矩阵计算,讨论了具有连续属性值的一般完备信息系统的概念格(Galois格)构建与规则提取问题。运用灰粗糙集的灰近似方法,构建实数Oalois格,完成了完备信息系统的区间属性值的处理。基于上下近似,分析了在完备信息系统上的不可定义集合与概念的形式概念简化表示方法。用近似粗糙集的方法,建立了不完备信息系统下的Galois格。研究内容与创新点主要包括: (1)等价矩阵反映了对象关于属性构成的等价关系的分类,在形式背景中定义的等价矩阵集中反映的是对象拥有属性的情况。因此我们定义的这种矩阵能够敏锐地体现出形式背景中属性的分布状况。我们提出了这种矩阵的“≤”和“⌒”的计算方法,研究了这种运算的性质。用等价矩阵计算建立了一种新的适合低密度属性分布的概念格快速算法。 (2)粗糙集理论的属性约简主要是对决策表属性的约简。约简的过程就是用可辨识矩阵和函数方法从决策表的条件属性中去掉不必要的(对决策不重要)的条件属性,从而分析所得约简中的条件属性对于决策属性的决策规则。本文研究了没有决策属性的形式背景中应用这种方法的条件、要求和途径。通过形式背景属性的约简实现了大数据集概念格的简化构建。 (3)现有的概念格方法不能处理连续及混合数据,粗糙集方法对连续属性值进行离散也多受限于决策属性。将一般粗糙集的候选分隔点的方法应用于连续属性值的形式背景,用可辨识矩阵通过定义属性分割点频率重要性函数进行优化进而实现连续属性值的离散。分析了这种方法的时间复杂度。在离散后形成的有限多值背景上给出了一种新的形式概念定义,完成了连续及混合数据的Galois格构建。 (4)灰色系统理论是一种处理少数据、不确定性信息的数学工具。在灰色系统理论中无任何规律的样本集可构成灰关联空间,建立起整体比较机制,且能够从中找出影响系统发展趋势的重要因素,提取灰色系统的重要特征。我们在灰粗糙集理论的基础上,建立了实数Galois格模型,在这一领域对概念格进行了扩展。研究了实数Galois格的一般特性、构建方法以及与传统概念格、模糊概念格的关系。研究处理了供货商选择问题,方法表现出比较好的推理特性。 (5)现有的粗糙集近似方法存在两个问题,一是定义的有效性。二是计算的复杂性。我们研究发现一个不可定义集可以直接用它所对应的属性(对象)的外延(内涵)做它的上近似,用这个不可定义集和属性(对象)全集除去它所对应的属性(对象)构成的局部背景中的包含度最大的形式概念外延(内涵)做它的下近似。这大大降低了计算的复杂度。从理论和实验上证明了方法的有效性。在此基础上提出了新的不可定义概念近似方法并研究了它的表示精度问题。 (6)基于相似关系的相似粗糙集能够处理有缺失或不确定值的不完备数据。在不完备信息系统中,通过定义缺失属性的完备强度,用对象相似集完成缺失数据的填补,进而确定了形式概念的完备背景。用相似粗糙集方法建立了不完备信息系统下Galois格构造、概念表示精度度量的方法。
其他文献
自然界中的动态行为可大致分为两类:一类是遵循物理学定律或者广义物理学定律,属于物理世界范畴的连续变量动态系统。例如,天体的运行、电荷的做功、人口的增长等。这类行为的状
无轴承永磁薄片电机的基本工作原理是电机采用无轴承技术实现径向两自由度主动悬浮,利用磁阻拉力实现薄片转子轴向和倾斜三个自由度的被动悬浮。无轴承永磁薄片电机作为一种高度集成的无轴承电机,除了拥有一般无轴承电机系统的所有优点外,它还具有轴向长度短、结构简单,成本低等特点,在工业领域引起了广泛关注,并得到迅速的发展与深入的研究,特别是在特殊的液体传输、超纯净驱动领域有广泛的应用前景。本文在江苏省高技术研究
这篇论文主要介绍了非线性系统理论的发展,尤其是输出反馈控制。反馈控制分为状态反馈和输出反馈。实际系统中,由于测量手段和技术条件的限制,系统的状态通常不能全部被测到,
近红外光谱(NIRS)分析技术能快速无损的测定样本,已在医疗行业和药品监督管理机构中得到了广泛的应用。针对NIRS药品鉴别领域,虽然,现有机器学习算法能较好解决NIRS样本中谱
伴随着我国社会经济建设的飞速发展,农村地区的城镇化程度不断提高,水资源污染的问题在乡镇和农村地区也日益突出。为了提高治理水资源污染的能力,我国乡镇和农村地区逐步建设了
移动机器人群编队控制是机器人群研究领域的重要问题,具有重要的理论和实际意义。  本文基于滚动时域控制策略探讨了移动机器人群的编队及避障控制问题。为使研究工作具有系
铅锌密闭鼓风炉熔炼过程生产环境恶劣、反应机理复杂,具有多变量、非线性、大滞后、强耦合的特点,使得熔炼过程信息存在一定的不确定及不完整性,即存在信息的不完备性。本文
针对无轴承异步电机是一个强耦合、非线性多变量复杂系统,本文在国家自然科学基金(60674095,50575099)的资助下,将神经网络与逆系统方法结合,提出了无轴承异步电机的神经网络逆解耦控制方法。该方法可有效地克服无轴承异步电机的未建模动态、参数变化及负载扰动对控制性能的影响,真正实现无轴承异步电机的线性化动态解耦控制。本文的具体内容如下:首先,介绍了无轴承异步电机径向悬浮力的产生原理,推导了无
随着汽车产业的飞速发展,车身电子模块的数量越来越多,而且功能也越来越复杂,导致车身控制系统(BCM, Body Control Module)的性能要求也需要不断提高。为此,如何实现车身控制系统更
针对卫星姿态控制系统,采用星敏感器/陀螺敏感器组合测量方式,首先,建立了卫星姿态控制系统仿真环境;其次,研究了基于滑模观测器的卫星角速度测量系统故障诊断,并验证了其可行性;最