论文部分内容阅读
RNA-seq技术是第二代测序技术的一项重要应用。近几年,这项技术不断发展和改进,目前已经被广泛地应用于基因组和转录组的研究上。本文针对RNA-seq的数据处理与主要应用展开了如下研究:1.提出了一种新的定位RNA-seq读段数据的方法。这种新方法利用一个动态变化的哈希表来减少搜索空间,从而提高定位效率。该方法不仅能够得到读段的连续定位信息,而且可以检测出跨越剪切位点的定位信息。这些定位信息可以用来预测尚未被发现的剪切位点,也可以用来更准确地评估基因的表达水平。2.提出了两种根据RNA-seq数据检测样本间差异表达基因的新方法。两种方法用不同的模型来评估背景噪声。在检测差异表达基因的过程中,都以MA图为基础,从而可以方便地将差异表达的基因可视化。3.根据读段定位结果预测了人类基因组上的剪切位点。数值实验结果表明:此方法预测出的剪切位点具有较高的敏感性与特异性。根据实验结果研究了测序深度对检测剪切位点的影响,并对检测出的未知的剪切位点在人类基因组上的分布做了分析。