论文部分内容阅读
植物育种是将育种亲本的优良等位基因聚合或将优良亲本的等位基因转移至适应亲本从而改良其产量、品质和抗性等性状的遗传操作过程。传统育种方法无法直接检测到优异基因,但一定程度上可通过表型表现检测到其携带个体。分子标记的开发和应用为优异等位变异检测提供了工具,使分子标记辅助选择(Marker-assistedselection,MAS)的技术和潜力得到了广泛的研究和应用。基于此,VanderVoort(2003)提出了“设计育种(Breedingbydesign)”的概念。该方法旨在通过将高精度遗传图谱、高精度染色体单体和表型相结合以控制目标性状所有基因的等位变异。为此,育种家需获取两类遗传信息:优异等位变异在染色体上的位置及邻近区域的标记和优异等位变异的携带者。换句话说,育种材料的基因/QTL(Quantitativetraitlocus)定位和亲本材料的遗传解析是“设计育种”两个必备条件。获取了育种材料优异等位变异及其效应的相关信息,育种家可设计高效的育种计划、将优异等位变异聚合至同一个品种中。 作物品种最基本的类型为家系品种和杂种品种,其他还有无性系品种和综合品种等。家系品种主要利用优异等位变异的加性和加性×加性上位性效应;杂种品种则利用优异等位变异的加性、显性、加性×加性、加性×显性和显性×显性上位性效应。在前人基础上,本课题组的研究计划为从统计遗传学和分子标记两个层面上发展对亲本材料基因/QTL等位变异构成及其效应的遗传解析方法。本文目的是在前人家系品种亲本遗传解析的3对主基因加多基因混合遗传模型分离分析方法基础上,建立4对主基因加多基因混合遗传模型分离分析方法;在前人杂种品种亲本位点组遗传解析方法的基础上探索检测亲本QTL及其等位变异构成的分子标记分析方法,从而初步建立杂种亲本改良的思路和方法。家系品种亲本分子标记遗传解析和设计育种的方法将由本组其他研究生完成。 (1)主基因加多基因混合遗传模型分离分析方法是基于数量性状表型数据的统计遗传分析方法,该方法适用于育种工作者利用杂种分离世代的数据对育种性状的遗传组成做出判断,制定合理的育种策略,也可校验QTL定位所揭示的植物性状的遗传组成。本研究分别以RIL(Recombinatinbredlines)和BIL(Backcrossinbredlines)群体为对象,在前人基础上,建立了4对主基因加多基因模型分离分析方法。建立的遗传模型包括4对主基因和4对主基因加多基因两类,其中RIL群体共包括15个遗传模型,BIL群体共包括11个遗传模型。通过极大似然法和IECM(Iteratedexpected/conditionalmaximization)算法估算各种模型的分布参数,由AIC值和一组适合性测验选取最佳遗传模型,再由最小二乘法估计模型的遗传参数。通过模拟试验分别对所建立的模型进行验证,模拟群体中一阶遗传参数的估计值与设定值的准确度均大于90%,其中部分参数的准确度接近99%,由此说明估计值与设定值之间有很好一致性。 (2)以大豆科丰1号×南农1138-2构成的RIL群体及其亲本棕榈酸含量的遗传为例说明用于RIL群体的遗传模型的应用效果。分析结果表明,大豆棕榈酸含量符合I-1模型,即4对加性-上位性主基因加加性-上位性多基因遗传模型。主基因遗传率为65.38%,多基因遗传率为34.62%。利用本研究建立的模型重新分析了大豆BIL群体(Essex×ZDD2315)及其亲本对胞囊线虫(HeteroderaglycinesIchinohe)1号生理小种的抗性数据,发现大豆对胞囊线虫1号生理小种的抗性符合I-3模型,即4对主基因中两对等加性主基因加多基因遗传模型,主基因遗传率为92.9%,多基因遗传率4.4%。与原分析结果相比,本研究估计的效应与原分析估计的效应相近,但增加了一个负效应主基因,主基因遗传率提高了3.0%,并获得了多基因遗传效应和多基因遗传率的估计值。这说明了拓展的遗传模型确实增加了遗传信息。这与QTL定位结果基本一致,验证了QTL定位结果,同时说明所建立的统计遗传方法对有主效位点的性状是有效的、简便的遗传分析方法。 (3)本文的重点在于建立用于双列杂交和NCⅡ(NorthCarolinadesignⅡ)遗传设计的基于遗传算法变量选择的偏最小二乘回归(Partialleastsquareregressioncombinedwithgeneticalgorithm,PLSRCGA)分析方法,用于F1杂种性状QTL分子标记定位及其遗传效应估计方法。鉴于供试群体所涉及亲本数有限而待估计参数量众多,解一般回归模型的自由度不够,难以实现有效的运算,并解出QTL定位的结果。本研究以F1表型数据为因变量,以标记位点的加性、显性效应为自变量建立遗传模型,利用遗传算法(Geneticalgorithm,GA)进行效应位点选择,利用偏最小二乘回归(Partialleastsquareregression,PLSR)进行参数估计。PLSR通过对方差协方差矩阵提取主成分降低变量空间的位数,由交叉验证(Crossvalidation,CV)确定PLSR的主成分数,以Qh2为交叉验证的准则,将这套方法称为PLSRCGA法。PLSRCGA方法由如下四个步骤组成:①建立GA初始群体,群体中每个个体(Chromosome)由0、1组成,个体长度等于标记数,0、1分别表示标记位点是否出现在遗传模型中,每个个体表示用于遗传分析的遗传模型;②利用PLSR估计每个遗传模型(个体)的RMSEP(Rootmeansquarederrorofprediction),即适合度(Fitness);③通过群体中个体的选择、个体间变量的交换和突变产生下一代的遗传群体。步骤②、③重复迭代直至群体收敛至群体稳定,则最优个体中所包含的变量既为所选位点;④利用PLSR估计所选位点的遗传效应及其贡献率。该法通过选取主成分有效的解决了遗传模型中数据量少和待估计参数量大的矛盾。 分别模拟了10个亲本的双列杂交和10个父本×20个母本的NCⅡ设计,分别用单标记分析、逐步回归分析方法和PLSRCGA分析方法对模拟数据进行分析,并对三种分析方法进行比较。双列杂交模拟试验中,设定了500个标记位点,设定其中的10个位点为效应位点,贡献率为80%。单标记分析共检测到71个效应位点,总贡献率远远大于100%,10个设定的效应位点的均被检测到了,选择频率均大于90.0%;逐步回归分析共检测到16个位点,其中8个为设定位点,选择频率介于22.7%-99.9%,贡献率的估计值为83.4%;PLSRCGA分析共检测到13个位点,且检测到了所有10个设定位点,选择频率介于87.4-98.7%,贡献率估计值为82.7%。NCⅡ模拟试验中,单标记分析检测到53个效应位点,总贡献率远远大于100%;逐步回归检测到14个效应位点,其中8个为设定位点,选择频率介于8.70%-100.0%,贡献率的估计值为72.70%;PLSRCGA分析共检测到13个效应位点,其中10个为设定位点,选择频率介于12.7%-100.0%,贡献率的估计值为87.93%。 (4)分别将单标记分析、逐步回归分析和PLSRCGA分析方法用于8个亲本的大豆双列杂交设计F1杂种产量分析。单标记分析检测到38个效应位点,总贡献率远远大于100%;逐步回归分析检测到8个效应位点,总贡献率为96.45%;PLSRCGA分析检测到6个效应位点,总贡献率为62.17%。将检测到的6个效应位点用于对F1杂种表型值的预测,发现预测结果与实际观测值接近,变化趋势一致。结合观测值和预测值发现淮豆4号×晋豆27、菏豆12×晋豆27、豫豆22×晋豆27和诱变30×蒙90-24为最优亲本组合。将这3种统计分析方法用于5×10的NCⅡ设计的大豆F1杂种产量数据分析。单标记分析对2年平均数据共检测到79个效应位点,总贡献率远远大于100%;逐步回归分析分别对两年数据及其均值分析,分别检测到9、8、8个效应位点,贡献率分别为65.53%、58.84%和65.73%;PLSRCGA分析分别检测到8、8、6个效应位点,贡献率分别为82.16%、84.23%和83.39%。将PLSRCGA检测到的效应位点利用PLSRCGA方法对F1杂种表型值进行预测,并将预测结果与实际观测值比较发现预测值与观测值很接近、且变化趋势基本一致。结合观测值和预测值的结果发现山宁16×周豆16、周豆13×徐9416-6B、周豆13×周豆17、周豆11×周豆16和周豆13×MN413为优异组合,其中组合周豆13×MN413明显优于其他组合。结合PLSRCGA的检测结果,本研究提出了杂种亲本遗传解析的策略。根据QTL-等位变异的遗传效应预测亲本组合的F1杂种效应、优选亲本组合,从而可降低育种的盲目性,提高育种效率。通过比较PLSRCGA的杂种预测值与实际观测值表明,PLSRCGA的预测结果与实际观测值的变化趋势一致,说明PLSRCGA可用于亲本杂种优势的预测。显性度的估计结果表明:在多等位变异的遗传体系中,加性、部分显性、显性和超显性效应是大豆杂种优势的遗传基础。 分别将单标记分析、逐步回归分析和PLSRCGA分析方法应用于模拟试验和实际数据的分析,并对三种方法进行了比较。结果表明,单标记分析方法由于受临近的与之连锁的位点及其他效应位点的影响,检测的假阳性很高,检测到的各个效应位点的总贡献率远远大于100%。由于受自由度的限制,逐步回归分析方法无法获得检测到的效应位点的所有待估遗传效应的估计值。模拟试验表明,PLSRCGA分析方法的假阳性低,估计的各个效应位点的贡献率与实际设定值接近,且可获得所有待估遗传效应的估计值。本研究所用的遗传交配设计中,各个位点的效应的系数向量常常相同或高度相关,这是单标记分析和逐步回归分析无法解决的问题,因此导致这两种分析方法有偏甚至有误。PLSR可以解决这类问题,可同时获得所有遗传效应的估计值。由此可见PLSRCGA分析方法在双列杂交和NCII设计的目标性状效应位点检测、遗传效应估计等方面优于单标记分析和逐步回归分析方法。 (5)为了使建立的分析方法便于应用,本研究编写了相应分析软件。基于MATLAB平台编写了用于RIL群体主基因加多基因遗传分析的软件saRIL1.0;基于R平台编写了用于BIL群体遗传分析的软件saBIL1.0。基于R平台分别编写了用于双列杂交和NCⅡ设计遗传解析的分析软件hpdPLSRCGA1.0和hpnPLSRCGA1.0。为了使软件可用于各种复杂数据的分析,软件hpdPLSRCGA1.0和hpnPLSRCGA1.0可同时在Windows和Linux系统下运行。