论文部分内容阅读
研究背景:人类基因组草图的绘制完成,标志着现代生命科学研究已经进入了后基因组时代,研究者把关心的焦点由结构基因组学转向了功能基因组学,对基因彼此之间的相互作用,尤其是基因表达调控网络的构建,研究者们表现出越来越多的关注。近代分子生物学实验技术及计算机科学的迅猛发展也使研究者系统地揭示隐藏在宏观生命现象下复杂的分子过程成为可能。基因芯片(Gene chip, Microarray)作为一种高通量的检测方法,可以同时测量成千上万个基因的表达水平,已成为后基因组时代研究基因间相互作用的一个有力的工具,如何从芯片实验产生的表达数据中揭示出其所蕴含的丰富的调控信息是研究者都渴望解决的问题。目前针对基因芯片表达数据的基因表达调控网络数学模型的研究尚处于起步阶段,虽然已有几种模型应用于这一领域,但各自都有一定的局限性,新方法的提出也是一种探索的过程。本研究的目的是在已有方法的基础上,提出一种新的算法,并针对这种方法设计一种建立基因调控网络的方法,编写相应软件。方法:①基于相关系数的分析方法是广泛应用于基因表达数据分析的方法之一。我们在已有的三种相关系数的基础上,借鉴模糊隶属度思想,提出一种新的模糊相关基因表达调控网络构建算法。②利用MATLAB工作平台,进行程序设计,研制一种新的构建基因表达调控网络的软件,并将已有的三种相关系数和模糊相关系数应用到人类胚胎期中枢神经系统发育过程基因表达数据中,建立调控网络,并对结果进行分析和比较。结果:①用四种相关系数的分析方法在各自阈值下建立基因表达调控网络,都能将参与同一生物学反应过程或具有相似功能的基因划归入同一个调控网络中,符合生物学假设。②线性相关系数和秩相关系数可以体现基因表达调控的趋势性,信息熵相关系数和模糊相关系数反应调控的依赖关系。③信息熵相关系数较为泛化,秩相关系数次之,线性相关系数和模糊相关系数相似,对数据的相关性趋势要求相对较高。结论:①模糊相关系数用于分析基因表达调控网络是可行的。②通过控制阈值来建立基因表达调控网络的方法是可行的,可为进一步的后续研究提供线索。