论文部分内容阅读
本研究采用凉山半细毛羊资源参考家系从1997~2007年间的相关育种资料(系谱、经济性状和分子遗传标记)作为研究对象。面向动物遗传参数评估工作的实践需求,运用数据仓库技术构建一套遗传参数估测系统,供遗传育种实践作决策支持。本研究数据源有亲权鉴定出的系谱数据、表型鉴定数据、分子遗传标记和QTL定位。对数据源分别实施校对记录,删除缺失记录,审查系谱等数据清洗后,消除所有数据噪声。面向遗传参数估测的实际需求,定义和划分了系谱、羊毛性状和体重性状等主题域。数据粒度层次划分遵循全局数据仓库的需求,遗传育种细节数据都划分为低粒度,表型值部分划分为中等粒度数据或者高等粒度数据。在从属数据集市当中,部分数据采用了双重数据粒度划分层次。按照确定好的系统边界,把遗传育种数据进行分区处理和预处理。相关数据源(结构化数据、非结构化数据)经过抽取、转换和装载之后,转入关系数据库中存储。然后,面向主题域抽取数据构建从属数据集市。本研究的数据仓库采用雪花型概念模型设计。依照动物遗传参数评估特点设计数据仓库的逻辑模型。数据仓库的物理设计和实现是运用多维数据模型理论。采用多维数据模型实现三个从属数据集市,即系谱数据集市、羊毛性状数据集市和体重性状数据集市。从属数据集市是关系型数据仓库当中分离出来的。数据集市的每一个维度存储一个数量遗传表型值。对每个数据立方体钻去、切片和旋转等操作来完成遗传参数汇总、聚集等工作,为决策实施服务。运用数据挖掘工具估测凉山半细毛羊的遗传参数,预测遗传进展、预测选择效果和杂种优势。生成的从属数据集市由数据挖掘工具检验其性能,表明数据仓库系统能够完成凉山半细毛羊遗传参数估测的实践工作。