【摘 要】
:
为了探索关于人类自身的编码而启动的人类基因组计划经过近三十年的努力已基本完成。随之而来产生了大量的生物分子数据,这些高维的数据内具有丰富的信息,其背后隐藏着人类尚未充分了解的关于自身的知识。利用数学、统计学与计算机科学相关方法帮助生物学家从海量信息中发现有价值的信息,促进人类医学研究领域的进步,这一迫切需求促进了生物信息学这一学科的快速发展。cDNA微阵列和寡核苷酸芯片等高通量检测技术应用至今已经
论文部分内容阅读
为了探索关于人类自身的编码而启动的人类基因组计划经过近三十年的努力已基本完成。随之而来产生了大量的生物分子数据,这些高维的数据内具有丰富的信息,其背后隐藏着人类尚未充分了解的关于自身的知识。利用数学、统计学与计算机科学相关方法帮助生物学家从海量信息中发现有价值的信息,促进人类医学研究领域的进步,这一迫切需求促进了生物信息学这一学科的快速发展。cDNA微阵列和寡核苷酸芯片等高通量检测技术应用至今已经积累了大量来自不同平台的数据,从现有数据中得到分类模式并应用于新的样本对基因表达数据挖掘工作具有重要意义。由于基因表达数据集的大都具有小样本,高维度的特性,在同一个平台上的少数样本数据相对于高维特征来讲是极其有限的。数据集样本数量的稀疏性在与特征的高维度性相叠加造成了维度灾难,导致难以从单个小样本数据集上提取鲁棒的关键信息。如果能够将GEO多个平台上的基因表达数据结合起来,通过增大样本数据量缓和维度灾难问题,这对于相关的研究工作是十分有益的。然而基因表达数据所涉及到的生物学实验是一个多步骤的复杂过程,由于其中生物样本的来源、芯片制作所采用的技术手段、设备标准的不同,多个平台的基因表达数据之间存在难以消除的系统性尺度差异。经典的归一化方法依赖于数据平台信息的统计量。本文针对分类模式难以在不同平台间迁移的问题,使用独立于平台信息的特征间相对表达关系作为模型的基础分类模式来适应跨平台基因数据的多样性,消除其平台特性造成的样本尺度差异进而推广相关研究工作的适用范围。更进一步,基于对特征对分类模型的非对称性分析提出了偏序模式作为基础的分类模式,构建能够引入更多规则的层级规则树分类模式来从样本覆盖的角度提升模型的分类性能。对于跨平台特性带来的大规模数据问题,基于分类规则为基因间相对大小关系的特性,本文设计了相应的数据转换和基于相对偏移的规则预筛选策略,来实现算法的快速挖掘。在真实基因表达数据集上的对比实验结果,验证了算法的准确度、稳定性以及高于现有方法两个数量级的运行效率,可以有效应对跨平台基因表达数据挖掘所带来的挑战。从高维数据中发现与数据尺度无关的模型算法的研究不仅可以应用于基因表达数据分类,在社交网络、推荐系统、金融分析等多个领域都取得了良好的效果。基因表达数据上的跨平台分类算法于上述领域的数据特性与研究与有很多共同之处,因此基于偏序模式的跨平台基因表达数据分类算法可以推广到更多的应用场景,有助于跨平台数据领域内的算法研究。
其他文献
目的:本研究主要探讨基于U-Net的神经网络利用磁共振图像衍生出合成CT(Synthetic computed tomography,s CT)图像在腰椎管狭窄诊断方面应用的可行性。方法:本研究共纳入了56
目的:本研究利用数据挖掘技术,归纳和总结于睿教授门诊病历,得出于睿教授治疗稳定性冠心病的用药规律,为中西医诊疗稳定性冠心病提供一定的参考作用,为中医的传承与发展提供
背景及目的面肩肱型肌营养不良(facioscapulohumerial muscular dystrophy,FSHD)为常染色体显性遗传病,是排名第三的遗传性神经肌肉病,发病率在1/10000-1/20000之间,目前无有
MCMC方法是一种求解高维非线性问题的有效手段,高能闪光图像重建问题就是一个典型的高维非线性反演问题。然而目前的大多数重建方法都是基于一个线性的近似模型,利用光程图像进行重建。由于闪光图像受到系统模糊的影响,基于该线性模型的重建结果较模糊,特别是在边缘附近。这类方法面对的主要难点是消除模糊及去噪声。而本文结合完整的闪光照相的成像过程,主要关注了闪光照相系统的模糊及噪声对重建结果的影响;讨论了线性模
目的:本次研究主要目的是通过比较杠杆试验中在同一杠杆的支点位置时使足跟抬离检查床面,需要施加在患者健侧与患侧大腿的最小压力数值,用以判断膝关节前交叉韧带损伤中患侧
目的:毒烟吸入所致的急性肺损伤(ALI)是具有较高死亡率的临床急危重症,也是火灾中最致命的因素,但目前对发病机制的研究仍较为匮乏。越来越多的证据表明,微小RNA-155(mi R-155)及
目的乌苏里瓦韦[Lepisorus ussuriensis(Regel et Maack)Ching]为蕨类水龙骨科瓦韦属植物,绿原酸为其主要活性成分,绿原酸具有抗氧化、抗肿瘤、抗菌、抗炎、抗病毒、免疫调节、
近年来,随着各种公共安全、灾害检测、社会反恐等事件的发生,智能监控视频异常事件检测技术在广场、火车站、银行和机场等公共场所中发挥着越来越重要的作用。传统的视频异常事件检测依靠人工对视频信息进行分析处理,但是海量的视频数据大大增加了工作量,这种方式不仅效率低而且容易漏掉可疑目标和异常事件。监控视频异常事件检测的研究可以满足视频数据分析应用中自动实时报警的需求,视频异常事件检测应用融合了图像处理、模式
棘胸蛙(Quasipaa spinosa)隶属于两栖纲无尾目叉舌蛙科(Dicroglossidae)棘胸蛙属(Quasipaa),主要分布于我国南部,少量分布于越南北部地区,具有很高的经济食用价值。前期分子
目的:体外实验研究法舒地尔通过抑制Rho/ROCK信号通路对高糖培养下的人肾小球系膜细胞(Humanmesangialcells,HMCs)炎症反应及其纤维化的影响。方法:代培养的人肾小球系膜细胞