论文部分内容阅读
随着生物技术和计算机技术的快速发展,人类已经步入了高度信息化的时代,这过程中产生了大量的生物信息数据,对这些海量的生物数据进行挖掘和利用并发现有价值的规律,已成为生物学与医学领域的一个重要研究内容。形式概念分析理论以的数学化的概念和概念层次为基础,能够作为数据挖掘的一个算法。在此基础上,洪文学教授提出了属性偏序结构图的构建理论,其主要优点在于可以将数据的框架结构和内在逻辑以网络图的形式进行完整表示,为数据之间的关联性分析提供了一种系统的可视化方法。本文以形式概念分析为基础,对形式背景的分层优化方法以及属性偏序结构图的构建理论进行了研究,提出了一种基于属性偏序理论的基因表达数据可视化知识发现的新方法。将属性偏序理论应用到基因表达数据的挖掘中,使用的基因芯片数据包括人类多组织基因芯片数据和乳腺癌基因芯片数据,通过对其进行规范化和离散化等处理,从中筛选出与乳腺癌相关的特异性基因。分别以基因和各组织的二元关系以及以及基因与乳腺组织样本的二元关系为应用背景,生成形式背景并构造属性偏序结构图。通过对属性偏序结构图的分析研究,发现了乳腺癌特异基因在各组织中的特定表达模式以及在肿瘤组织中差异表达的基因,为发现未知的与疾病相关的特异基因提供了有效的方法。