论文部分内容阅读
重组率在遗传连锁分析中起着非常关键的作用,尤其是在建立连锁图谱进行基因定位时,对重组率进行统计推断是一个必不可少的环节。遗传学中连锁分析是指通过对基因数据的分析在基因组上去寻找感兴趣的基因的位置。人类基因组测序工作的完成,为寻找感兴趣的基因提供了很多已知的标记位点。目前,科学家们已经定位了许多单基因疾病的位点,并且每年都有新的发现。基因定位本质上就是对基因组上一个给定的标记位置,利用统计方法确定感兴趣的性状位点距离这个标记位置有多远。从统计学的角度来讲就是要估计重组率,从而确定两个位点间的距离,这个距离可以经图谱函数由重组率转换而来;或者做假设检验来回答这个感兴趣的性状位点是否与已知的标记位点比较近这一问题.然而目前已有的有关重组率的推断方法几乎没有考虑到重组率自身应该满足的一些自然而又必要的约束条件,忽略了这些约束势必会对遗传学中的统计推断带来影响,最终会导致与实际不相符的结论出现.本文的主要工作之一就是强调了重组率应满足的-些自然且必要的约束条件,给出了这些约束下的两位点重组率的统计推断方法;此外,本文还考虑了远交群体中的连锁分析和数量性状位点定位中的统计推断问题。
本文首先就相型信息未知的三回交家庭情况进行讨论,并给出了在一些自然的不等式约束下的重组率推断方法。针对每个观测家庭有两个后代时,我们提出了一种约束期望最大化(EM)算法,称之为REM算法。鉴于多个观测后代能提供更多的信息,我们把所研究的问题推广到了多后代情形,并给出了任意后代个数时表型的分类方法和分类数公式;同时我们推广了不同相型的等概率先验假设,结果显示我们提出的REM算法是适合于多种情况的一种通用的算法。其次,我们还介绍了远交群体中连锁分析所关心的问题以及解决办法。最后,本文就当前比较流行的数量性状位点定位进行了一些研究,考虑了基因组上存在交换干扰时数量性状位点的区间定位问题。我们通过模拟研究或实例分析考察了上述各种方法在应用中的可行性,并且通过和其他方法的模拟比较研究分析了其优劣性.无论是理论分析还是模拟研究都显示我们的方法在实际应用中是可行的,而且还能提高重组率推断的效率.