基因芯片表达数据分析相关问题研究

被引量 : 0次 | 上传用户:boluoqb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
论文以基因芯片表达数据分析技术为研究课题,围绕基因芯片表达数据预处理技术,基因芯片在肿瘤研究中的相关问题以及基因表达调控网络建模技术三方面问题进行了深入分析和研究,其主要内容和创新之处包括:1)寡核苷酸芯片系统偏移的校正方法研究基因芯片实验涉及多个芯片,因此有必要排除非生物因素引起的芯片间的变异,使得来自不同芯片的数据具有可比性。在对比分析中,通过系统校正能够减少芯片间的系统偏差,使得芯片检测的结果能真实反映生物功能的差别。论文对寡核苷酸芯片系统偏移的校正进行了研究。提出了一种迭代的鲁棒基准芯片校正方法。通过对各芯片上的探针进行排序,选择一个秩差异最小的探针子集,然后利用Tukey biweight算法计算一个伪基准芯片,最后基于伪基准芯片对目标芯片采用M-A非线性校正。对上述过程进行迭代,当达到最大迭代数或者探针杂交强度校正前后的差值低于某个阈值时停止。以Affymetrix公司提供的标准检验数据集HG U133A Spike-in Dataset作为测试数据,与多种现有的方法进行了对比分析,显示新方法具有更好的性能。2)基因芯片表达数据缺失估计算法研究在基因芯片实验中,经常存在数据缺失现象,这会影响芯片数据后续分析结果的准确性。缺失值估计是在不增加实验次数的情况下降低缺失数据对后续分析影响的有效方法。通过利用相似性信息的核加权函数实现缺失值回归估计的局部化,给出了基于加权回归估计的基因表达缺失值估计方法。在两种不同类型的基因芯片表达数据上,将新算法与几种已知的算法进行了比较分析。实验结果表明,新的估计算法具有较传统缺失值估计算法更好的稳定性和估计准确度。3)肿瘤基因芯片表达数据的分类诊断算法研究肿瘤基因芯片表达数据分类是一个典型的高维小样本分类问题。当前已经提出了很多有效的分类算法。提出了基于两步策略的肿瘤基因芯片表达数据分类算法。在测试的基因中存在大量的非差异表达冗余基因,为了有效减少其对分类效果的影响,首先利用ReliefF方法对基因进行预选择,得到一个较小的分类基因子集;然后分别建立了基于相关向量机和基于免疫优化支持向量机的分类预测模型。在四个真实的肿瘤基因芯片表达数据上,与几种不同的算法进行了比较,结果显示新算法可以得到更好的分类精度,同时表现出很好的稳定性。4)肿瘤基因芯片表达数据的分型识别算法研究肿瘤是高度异质性的疾病,不同的发病原因会导致相同的表型。基于临床病理检测很难对肿瘤进行准确的分型诊断。基因芯片技术提供了一种高通量的在分子水平观察肿瘤发生和演变的手段,利用基因表达数据可以对肿瘤组织样本进行准确的分型识别。支持向量聚类是一种基于边缘检测的聚类方法,对非规则的类分布有很好的聚类性能,能够发现样本真实的类分布。给出了基于支持向量聚类的肿瘤分型识别算法。对两个肿瘤基因芯片表达数据进行了分型识别分析,利用自动生成的参数序列,对样本进行不同程度的精细划分,结果显示,基于支持向量聚类的方法能够更准确地对样本进行分型识别,而且能够自动发现肿瘤样本真实的类分布。5)基于反向技术的基因表达调控网络建模技术研究基因表达调控网络的机制不仅仅是基因间的相互作用,还包含各种调控因子的相互作用,诸如,相关的调控蛋白质,siRNA等等。而这些调控因子不易直接测量。状态空间模型能够很好地描述基因表达调控网络复杂的调控机制。基因表达调控网络具有典型的稀疏特性,即基因的表达只被极少数的基因和调控因子所调控,同时,具有相互调控作用的基因间,在其连续表达水平上表现出较强的相关性。针对基因调控的稀疏子模块特点,先利用相关性聚类对基因进行分解,得到多个基因簇,然后利用状态空间方程对每个簇的基因间相互调控关系进行建模分析。通过在不同聚类数量水平上的建模结果进行综合分析,可以得到具有保守特性的基因间相互作用关系,从而得到一个稀疏的调控网络。对人类T细胞周期基因表达数据进行了分析,结果显示,随着聚类数量的增加,通过分解建模,可以更好地对网络进行重构。同时,建立了不同保守程度的稀疏调控网络模型。
其他文献
利用和频技术产生589 nm 高效辐射在强激光技术、天文观测以及激光医学等领域具有重要的用途。强激光在大气中传输时,通常需要采用自适应光学技术进行畸变校正,这就要求一个
本文应用互易性原理研究了两个邻近目标的复合电磁散射问题,将求解二次耦合散射场的计算公式简化为求解一个目标的散射场和另一目标极化电流的积分方程形式,降低了求解难度。
软件无线电是当前无线通信领域的研究热点,其理论逐渐走向成熟,并在实际中取得了成功的应用。在软件无线电实现上,各种数字信号处理算法通常采用通用DSP来完成,这样做虽然可
Zehavi指出,在编码器输出端添加比特交织器,并使用恰当的软判决信息作为Viterbi译码器的输入,可以进一步改进编码调制在瑞利衰落信道下的性能。与TCM不同的是,BICM引入了比特
自从2010年11月28日邂逅法国卢浮宫藏意大利文艺复兴艺术之后,中央美术学院美术馆在今年的3月6日与意大利艺术再续前缘,与乌菲齐博物馆联袂推出了“乌菲齐博物馆珍藏展”。本
内蒙古岱海发电有限责任公司3号机组在运行中3A、3B低压旁路阀因存在不同程度的内漏,阀后温度分别达到120℃、297℃.从旁路阀结构和安装工艺等方面进行改造:将阀座密封面由外
城市交通流中存在着大量可挖掘的信息,对于这些信息的获取、总结和应用是我们治理交通问题的核心手段。基于多样化的通信手段形成的车路协同系统开辟了在智能交通系统环境下
家庭语文教育在培养小学生语文学习兴趣方面扮演着重要的角色。目前我国对培养小学生语文学习兴趣的研究主要集中在改革语文教师教学方法、提高语文教师教学技能等方面,很少
<正> 课程理论主要是研究学校应该教什么?为什么教?怎样选择教材?怎样安排和组织教材?等等。课程理论的各家各派,主要就是对这些问题的看法有分歧。 国外课程理论的流派很多,