论文部分内容阅读
在现代动物育种中,利用高密度的基因组标记进行基因组选择(GS)可以获得较大的遗传进展。然而,高密度的芯片也带来一些缺陷:(1)一些不存在效应的SNP可能会被估计出效应,这将降低基因组育种值(GEBV)的估计准确度;(2)标记与标记之间可能存在着很强的相关性,由于基因组选择并不估计标记之间的上位效应,过高的标记密度反而会带来较大的误差;(3)高密度的标记需要很长的计算时间,给算法设计上带来巨大的挑战;(4)高密度的标记带来很高的育种成本,不利于对小型的畜种进行基因组选择育种。而低密度的基因芯片可以在算法设计和经济效益上一定程度地弥补上述缺陷。因此,本试验将尝试选取基因组中的部分与性状有关的标记(SNP)进行GEBV估计。
试验一采用计算机模拟的自然群体作为参考群进行研究,使用SMA(单标记分析)或SME(通过计算出的效应筛选标记)两种方法对标记进行筛选,使用emBayesB或GBLUP作为最终估计个体基因组育种值的算法。模拟中,设置了不同的参数,比如遗传力和影响性状的QTL数目,并对估计群模拟了6个世代。筛选标记的方法及最终结果如下:
(1)当使用所有标记直接估计GEBV时,使用emBayesB和GBLUP两种算法都存在遗传力越高育种值估计越准的情况,从而反映出遗传力是决定GEBV估计准确度的因素之一。随着QTL数目的增多,emBayesB的估计准确性在下降,原因在于QTL数目的增多使得每个QTL平均所占有的遗传方差贡献率减小;然而这种情况没有出现在GBLUP算法中,原因在于GBLUP的先验分布更适应于基因组中QTL较多的情况。
(2)SMA将基因组中的每个标记都分别与表型值进行关联,通过显著性检验得出的P值(F值)作为最终筛选标记的标准。SME是使用emBayesB算法计算基因组所有标记的效应,根据标记的效应(方差)对标记进行筛选。结果显示,SME筛选方法更有利于结合emBayesB,而SMA方法更有利于结合GBLUP方法来制作低密度芯片进行基因组选择。如果是计算GEBV使用的是GBLUP算法时,无论是使用SME方法还是SMA方法,筛选标记之后的计算结果都明显好于筛选之前,但SMA筛选的优势更多地体现在保留的标记数目比较多的时候,当保留标记数目很少时,SME的效果好于SMA。
(3)无论是通过SME还是SMA方法有针对性地筛选标记,效果都比随机地选择标记的效果要好的多,这说明我们的方法对筛选有效应的标记有一定的意义。
试验二尝试采用了R-SMA(限制一定区间内的标记数目)方法与简单的SMA方法进行对比,目的是完善SMA方法中的缺陷。结果显示,当保留下来的标记数目很少的时候,R-SMA对GEBV估计的准确度高于SMA,这进一步证明了当寻找与性状关联的标记时,SMA容易遗漏效应较小的标记。R-SMA方法为要进行极低密度标记的基因组选择工作者提供了参考。
试验结果证明,通过预选标记法进行基因组选择是有可能提高GEBV估计准确度的。考虑到整个过程没有增加标记密度和参考群数目,计算上额外花费的成本又基本可以忽略,同时筛选标记制作出来的小芯片在连续几代内又可以节省育种费用,这种方法对分子育种工作和小畜种进行基因组选择起到了很好的参考价值。