基于SVM的多病类诊断基因选择方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:lcm2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生物技术的发展,DNA微阵列数据为基因诊断、基因治疗等提供了前提和可能性。基因选择是基因诊断的基础,如何在超高维小样本的基因表达数据中选择那些与疾病相关、对疾病分类有用的诊断基因,保证基因诊断的有效性和可靠性,成为了一个具有挑战性的课题。本文针对基于SVM的多病类诊断基因选择方法进行了研究。从对两病类的基因分类贡献表示的讨论入手,提出了四种基于SVM的多病类基因选择方法:(1) 基于和贡献的基因选择方法,将基因分多个病类对的贡献求和,作为该基因分所有病类的总贡献,进行基因选择;(2) 基于类模式的基因选择方法,从类中心之间的分类间隔考虑基因分病类对的贡献;(3) 基于相关性的贡献空间方法;(4) 基于相关性的和贡献基因选择方法。它们都是基于one-versus-one方式多类SVM分类方法进行基因选择的,其中,方法(1) (2) 对所选基因相关性无约束,方法(3) (4) 对所选基因Pearson线性相关性有约束。通过用真实的基因微阵列数据进行大量实验,本文在4种病类2308个基因中选择出的性能最好的基因子集包含7个基因,在3种病类4026个基因中选择出的性能最好的基因子集包含7个基因。选择出的诊断基因不但数目少,诊断能力也很强,表明了本文提出的几种方法的有效性。
其他文献
随着计算机技术、多媒体技术的迅速发展以及Internet 的不断扩大,图像信息变得越来越丰富,如何快速地找到需要的图像成为亟待解决的问题。基于内容的图像检索技术旨在搜索出
近年来,数据仓库和数据挖掘等新技术的迅速发展为决策支持系统(DSS)的发展开辟了新途径。将决策支持系统由传统的以模型库系统为主体,通过定量分析进行辅助决策转向由数据驱动
随着计算机网络的不断发展,网络的安全问题也日益突出,网络安全的一个主要威胁就是通过网络对信息系统的入侵。特别是存储的各种关键信息,经常遭受恶意和非法用户的攻击,使得这些
本文主要研究的切换判决问题,引入了强制接口优先、切换模式选择、接口标称带宽、小区带宽、信号强度、丢包率、网络侧接入控制、终端侧数据流量、移动预测等参数,并设计了基于
当前,Web技术在Internet上得到了广泛的应用,它支持实时的信息发布、动态的用户交互以及与后台系统灵活安全的连接。因此如何构造功能更加强大、应用更为灵活、开发更为简单的W
以计算机网络和卫星通讯技术为支撑的现代远程教育在最近的十年里取得迅速的发展,体现出时空自由、师生分离、系统开放、协作共享、资源融通的特点。但是,如何利用互联网技术面
本文围绕CDMA扩频通信理论和DWT(Discrete Wavelet Transform)变换在数字水印中的应用展开研究.从理论和实验角度深入分析其稳健性能,并提出新的水印算法.主要研究内容如下:(
应用层组播将组播的功能提升到应用层,通过端主机来实现,具有无需改变底层网络结构,部署灵活方便等IP组播无法比拟的优点,这也是著名的“端到端论点”所倡导的思想。应用层组
Internet是一个庞大的、全球性的信息服务中心,它提供了各种各样的信息服务。但随着WEB上数据的爆炸式的增长,数据信息的有用性变的越来越重要了。Web挖掘技术正是基于这一背景
近年来,随着数据库在不同领域的广泛应用,用户对于信息的查询处理提出了更多元化、更高效的要求。数据查询中简单的聚合(如MAX、 MIN、 SUM、 COUNT)很容易计算,但查询获得的