论文部分内容阅读
生物信息学,是作为80年代兴起的交叉学科,可破译隐藏在DNA序列中的遗传语言。如今,随着生物信息学与计算机科学的高速发展,国际国内的相关研究越来越多,各种生物数据呈爆炸式增长,各种数据库也相继建立并日益完善,更加激起了研究者的热情也使得一些研究工作更加便捷、高效。近年来,随着社会经济和科技的发展,生活在高原地区的人民、守护在祖国边疆的边防战士、为科研奋斗在高原的学者等人群的高原病越来越收到国家的重视,其中高原高血压是常见的高原病之一。长期生活在高原或是第一次来高原的很多人都会有不同反应,因此对高原高血压的研究具有重要的意义。本文以生物信息学为基础,在阅读大量的高血压相关文献以及结合其他研究生的相关研究基础上,通过对基因的差异性表达及其SNP注释等方面来对高原低氧环境下影响高血压的相关基因进行研究,通过查找、搜集可靠地数据来源,通过对比多个数据库,对所获取的数据进行整理、分析,使数据来源更加可靠,为后续的分析提供有力基础保障。本文也充分利用计算机技术,使用比较便捷的工具进行研究,如通过NCBI所提供的GEO2R实现对相关基因表达谱预处理,方便快捷的获取相关结果。为了实现对基因表达差异性分析的结果更加直观,采用了比较流行的可视化工具Cytoscape,它提供了丰富的插件接口,使结果展示更加直观、有针对性。在科学工作流程化分析方面,使用了目前比较热门的BioKepler工具,它在大量数据处理和分析集成等方面非常突出,并且集成了R、MatlAB等通用的分析以及可视化软件,使得本文的流程分析快捷、高效。总之,本文结合数据挖掘技术和生物信息学,充分利用计算机资源,对高原高血压的相关基因做了分析,得到了目前已知的影响高原高血压的基因,并对这些基因的SNP注释得到在高原环境下针对高血压症状中比较重要功能的基因突变,将这些分析结果以图形、图像等直观的展现出来。这为其他研究者高血压相关的差异表达基因的分析以及重要突变位点等的研究提供了一些借鉴。