【摘 要】
:
现今,通过计算机科学与技术,对其他领域进行数据分析已经变得广泛起来,尤其是在生物和医学领域上,存在着大量的亟需分析的数据,它们通过传统医学方法无法统一而有效的进行剖
论文部分内容阅读
现今,通过计算机科学与技术,对其他领域进行数据分析已经变得广泛起来,尤其是在生物和医学领域上,存在着大量的亟需分析的数据,它们通过传统医学方法无法统一而有效的进行剖析,或是通过传统的计算机技术无法高效的发掘数据背后的专业信息,而许多对临床医学具有指导意义的生物信息隐藏在它们之下。同时,数据的规模发展之快亟需新的更加高效的处理方法来解决现今的实际问题,胶质母细胞瘤(GBM)是一种棘手的癌症,对于胶质母细胞瘤相关生物信息,本文力争使用模式识别相关技术进行分析,来探求基因背后的知识,设计并实现一种新的发现算法来找到可以对胶质母细胞瘤样本分类起到决定性作用的特征从而发现胶质母细胞瘤亚型。本文针对胶质母细胞瘤数据进行多方面的数据处理,包括首先对胶质母细胞瘤数据进行规范化使之便于数据分析,其次利用胶质母细胞瘤数据特征的密度信息来使样本分类更加友好而清晰的可视化,同时提出一种基于规范化线性判别分析算法和最大相关性最小冗余度算法的数据降维算法RELRED,通过RELRED算法对数据进行降维和冗余处理从而解决胶质母细胞瘤数据的高维特征问题,使胶质母细胞瘤亚型更容易的被发现。最终,为了清晰的发现胶质母细胞瘤亚型,即对胶质母细胞瘤样本分类具有指导意义的相关特征,本文提出了基于特征识别的监督学习下非负矩阵分解算法SJNMF,SJNMF算法通过将联合矩阵进行统一分解,同时在算法的迭代过程中将分解结果紧密的与数据的标签分类信息关联,最终不仅仅进一步降低数据维度,而且完成对重要的数据特征提取从而发现胶质母细胞瘤亚型。项目采用了TCGA癌症数据库中的相关数据集,按照胶质母细胞瘤数据处理流程,RELRED和SJNMF两部分算法对TCGA数据进行了数据分析,同时与其他常用算法进行了比照,结果表明了RELRED和SJNMF算法在计算速度与计算准确度上的所具有的优势。
其他文献
中国经济正在高速进入“新常态”发展阶段,商业银行面临着宏观经济转型和互联网金融的双重冲击,曾经主要依靠的盈利方法和以存贷款为主的业务模式已经无法适应当前经济的发展。处于时代浪潮冲击之下的H市农业银行在外部营商环境和内部行业发展潜移默化的影响下也积极主动地寻求自身的转型发展,改变中介地位弱化、客户流失严重,利润空间紧缩的现状,力求在未来的经济发展中谋求一席之地。本文在总结了战略管理理论、战略转型理论
利用位移反分析方法去反演岩体力学参数是一种行之有效的方法。目前横观各向同性岩体位移反分析的研究只是针对于单洞室,研究双洞室乃至多洞室问题的较少。通过推导横观各向
壳聚糖及其衍生物具有生物相容性、可降解性、吸湿性、抗菌性、成纤成膜性等优异特性,在医药、食品、纺织、日化、造纸等领域具有广阔的应用前景。由于分子内与分子间存在着
植物内生拮抗芽孢杆菌是一类定殖于健康植株中并与植物建立和谐关系的一类微生物,具有抗病、促生、提高植物抗逆能力等多种生物学功能。近年来,国内相继对多种植物内生菌的分
本次口译实践的源语材料来自选取第二十五届媒体融合技术研讨会(ICTC2017)上华数传媒的常务副总裁乔小燕主题演讲《智慧化新网络,融合化新媒体》。在本主题演讲中,由于口语交
1997年,Meijer首次发现脲基嘧啶酮(Upy)单元具有自识别形成四重氢键的能力并可用于构筑氢键超分子聚合物和可逆交联网络材料。Upy单元自识别形成四重氢键的特性使其在制备超
稠油资源在我国所占比例较大,稠油开采主要采用注蒸汽的方式运行。为了减少注蒸汽过程中的热量损失,采用隔热油管作为注气媒介。然而随着隔热油管隔热技术的提高,作为隔热油
随着现代机械加工技术不断向高速化、高效化、高精化、干切削、硬切削等方向发展,对刀具涂层提出了更高的要求。基于WN涂层的优异性能,且与WC具有相同的晶体结构和相近的晶胞
杯芳烃具有易于修饰、结构灵活等特点,而且具有独特的自组装能力,因此,杯芳烃的衍生化一直是超分子化学领域一个非常热门的研究项目。本论文的主要工作从杯[4]芳烃出发,对其
ManagementGame(以下简称MG),是美国卡内基梅隆大学创办的企业模拟运营课程,通过多年的运营和国际有关院校的交流,现在已经成为MBA管理教育的一门优质的课程;课程以计算机和