支持向量机在基因表达数据分析中的应用

来源 :中国农业大学 | 被引量 : 0次 | 上传用户:a570121851
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
后基因时代,随着基因芯片技术的广泛应用,基因芯片实验数据爆炸式地增长。早期主要以聚类算法探索完全未知的基因表达模式。随着基因分类、基因表达模式的逐步明朗,许多更有效的有监督学习算法得到了广泛应用,准确、高效地预测未知基因的功能。支持向量机由于自身诸多优良的特性,使其在基因表达谱数据分析方面颇具吸引力。但是,极其有限的生物实验结果相对于巨大的基因芯片数据来说,所提供的已知信息非常贫乏却很宝贵。如何针对基因表达谱数据的这一特点,进行有效地SVMs分析,鲜有文献报道。本文正是针对这一特点,从拟南芥根部基因表达数据分析这一典型实际例子出发,对基因表达谱数据分析进行深入的研究。 本文主要研究工作如下:1.针对类别数未知,但有极少量已知类别训练点的拟南芥根部基因功能分类的问题,提出了一种基于距离度量学习的多分类支持向量机算法。 2.提出一种推理型多分类支持向量机,并将其转化成一个无约束最优化问题来求解。并将其应用于拟南芥根部基因表达数据分析中,为基因表达数据分析提供了一种新途径。 3.讨论了一种半监督支持向量机模型,该模型将半监督分类的组合优化问题转化成半定规划问题来求解。运用半定规划软件包,完成了算法的具体实现。为基因表达数据分析提供了又一种新方法。 总之,本文针对基因表达谱数据分析问题的先验知识极其贫乏的特性,研究并提供了三种不同的分析方法,数据试验验证了它们的有效性。
其他文献
本文对近年来发展起来的高维数据的多尺度表示工具:脊波、曲波的构造方法和性质进行了总结。脊波分析可以理解为radon域上的小波分析,而radon变换把空域的直线奇异映射为rado
自从20世纪20年代,P-P模型:捕食者-猎物模型被Volterra提出后,它就成功的解释生物界的一些现象,例如:物种个体迁移、竞争现象、捕食现象、利他主义对生态系统的影响等。对P-P模型
随着我国社会主义市场经济的不断发展,我国企业管理水平也在不断提高。面对日趋激烈的市场竞争,如何才能够占据一定的市场份额,已成为当前企业发展过程中亟待解决的重要问题
期刊
非凸优化问题是一类重要的优化问题,它能过广泛应用于分子生物学、环境工程、信息技术和工业制造等领域.一般情况下这类问题存在大量的非全局最优解的局部最优解,求解起来比较
本论文利用时间序列建立了一个趋势回归(最小二乘法)模型、虚拟参数的季节模型、以及时间序列分析的统计预测模型。该模型能够很好地分离出时间序列中的趋势成分,且能够很好地
本文主要研究脉冲泛函微分系统{x(t)=f(t,xt),t≥t0,t≠tk,△x(t)=Ik(x(t)),t=tk,k=1,2…,xt0=(ψ)及脉冲混合微分系统{x=f(t,x,λk(xk)),t∈(tk,tk+1),x(tk+)=xk+,xk+=xk+Ik
本文分成两部分,在第一部分,我们利用空间形式Rn+p(c)中等距浸入的紧致无边子流形Mn的广义位置向量场,通过建立两个关于广义位置向量场的切部,法部和Mn上的Laplace算子第一非零特