生物序列的相对特征分析及Burrows-Wheeler方法

来源 :大连理工大学 | 被引量 : 1次 | 上传用户:xiaok131
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着后基因组时代的到来,面对着大量的基因组的完全测序及各种问题的涌现,人们期望低成本的序列比较分析工具能够更精准、更快速的分析和预测序列的结构与功能,从而降低用实验方法测定与分析而带来的高额时间与金钱成本。本文致力于生物序列分析的研究领域,提出具有一定特色的比较分析模型。通常,序列的比较分析主要被分成两类模型:比对模型和非比对模型。本文从比较分析流程的拓扑框架上看待各种比较模型,提出将比较分析模型分为特征分析模型及相对特征分析模型。比对模型及基于信息压缩的比较模型都属于相对特征分析模型。在相对特征分析模型中,相似性假设是这类比较模型的一个核心内容。通过分析相似性假设可以得出该模型的主要的优缺点。本文重点研究讨论了两类相对特征分析模型:基于序列间公共子串的比较模型和’Burrows-Wheeler方法。本文提出的基于公共子串的比较模型是通过讨论最长公共子串与最短特异子串之间的关系而得出的一种模型。其主要特点是:算法的时间复杂度为线性的,从而适合分析很长的基因组;其中的局部距离度量可以较好的分析基因组间的局部相似性,即使所考虑的局部包含了部分片段的重组信息;根据局部距离度量而得出累积局部距离也能有效的分析基因组的整体相似性。通过对HIV-1全基因组及其片段的子型判别的问题的研究,我们验证了该模型的有效性。Burrows-Wheeler方法是另一类本文重点研究讨论的相对特征分析模型。其理论主要基于信息无损压缩理论中的一个重要的可逆变换——Burrows-Wheeler变换。在此变换的基础上而得出的扩展Burrows-Wheeler变换可以有效的分析序列间的共有因子的含量。本文提出了一种称为Burrows-Wheeler相似性分布的概念,并用其来描述序列间的相似性。在此基础上,我们提取Burrows-Wheeler相似性分布的两类数字特征——期望和信息熵,并针对基因序列、蛋白质序列及其结构序列的特点,采用不同的策略比较它们之间的相似性。
其他文献
指出创新教育对高校教师提出了新的其挑战,创新教育要求高校教师树立新观念,提高素质培养创新人才.
多媒体教学的运用适应了中学生的认知规律,符合中学生的年龄特征,为教育教学工作注入了新的活力,对提高课堂教学效率,推进新一轮课程改革起到了越来越明显的支撑作用.
定西市经济基础薄弱,自然资源匮乏,能源有限,投资环境相对较差,正常融资难度很大.充分利用有限财政资源,通过融资担保机构按倍数放大,争取更多银行信贷资金以实现融资目的就
多属性群决策主要研究专家群体根据属性指标对方案进行评价和排序。面对复杂的决策问题,由于专家们的教育背景、文化知识、经验、表达方式的制约,针对一些定性的属性,专家们往往难以精确地定量地对决策方案进行评价,通常给出区间数和模糊语言等评价信息。针对上述具有不同类型属性值评价信息的多属性群决策问题,参与决策的专家往往给出关于方案的总体评价,例如,偏好序。如何基于不同类型属性值评价信息与专家给出的方案偏好序
miRNA是一类长约22个核苷酸的小分子单链非编码RNA,其在转录后水平对基因表达进行调控,广泛参与机体的各种生理和病理过程。miRNA研究领域迄今为止经历了三次突破:第一个阶段
建筑外墙面的污染,尤其是不均匀污染是影响建筑立面观感及耐久性的重要原因.只要我们了解这种污染的成因,从外装饰材料的选用和建筑立面的细部处理上创造条件,就可以避免或减
随着近几年船舶业发展环境的变化,世界范围内对于船舶的安全问题及环境保护等方面的意识正在逐步提高。以过去重大海难事故为教训。以国际海事机构(IMO)为主导.正在制定相关的国
<正>怀着一腔热情,在教学一线坚持摸索,不断尝试,感想很多,收获也不少,曾因失败而沮丧,也曾因收获而欣喜,不变的是一如既往的坚持和努力。新一轮基础教育课程改革,新的教学理
会议