基于CART算法的肺癌微阵列数据的分类

来源 :生物信息学 | 被引量 : 0次 | 上传用户:hitsanmao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因芯片技术是基因组学中的重要研究工具。而基因芯片数据(微阵列数据)往往是高维的,使得降维成为微阵列数据分析中的一个必要步骤。本文对美国哈佛医学院G.J.Gordon等人提供的肺癌微阵列数据进行分析。通过t—test,Wilcox—on秩和检测分别提取微阵列数据特征属性,后根据CART(Classification and Regression Tree)算法,以Gini差异性指标作为误差函数,用提取的特征属性广延的构造分类树;再进行剪枝找到最优规模的树,目的是提高树的泛化性能使得能很好适应新的预测数据。
其他文献
采用基于Web三层结构的系统结构,利用PHP技术与MySQL网络数据库的结合实现了基于Web的高校实验中心网站的设计与开发,并介绍了网站的基本内容及强大功能。
分别用PCR方法扩增了1.7kbp和1.6kbp的猪PSP-Ⅰ和PSP-Ⅱ基因的启动子,并进行TA克隆,测序鉴定,测序结果用DNAstar程序与Genebank中的相应序列进行对比分析,结果显示与已发表序
病例:患者,女,70岁,有高血压病史,于2006年7月曾在我院体检,各项生化检查均正常。同年10月血糖升高,经医生诊断为糖尿病,开始口服阿卡波糖(拜糖平,拜耳医药保健有限公司,批号:10