基于智能算法的信息SNP选择方法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:cderfvbgtyhnmj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
单核苷酸多态性(Single Nucleotide Polymorphism,SNP)指的是在基因组水平上因单个核苷酸变异所引起的DNA序列的多态性。关联分析中尽管使用所有的SNP可以具有较高的效能,但是代价过于昂贵,而寻找包含大量信息的tag SNPs位点,不仅可以降低成本,而且可以尽可能的保持关联研究效能。目前,已有较多的方法被用于信息SNP选择的相关研究中。但是,这些方法仍然存在不足,主要表现在这些方面:时间复杂度较高、所选择信息SNP数目过多、预测准确度偏低或者所选取的信息SNP在后续关联研究中效能低等。因此,在本文中,针对这些不足提出一种基于智能算法的信息SNP选择方法以更符合实际研究的需要。主要的工作和创新点如下:本文首先描述了信息SNP位点的选择问题,并比较了各种国内外基于不同思路的方法之间的优缺点,并详细阐述了基于预测准确度方法的基本思想及主要步骤。然后为了降低算法时间复杂度,本文提出采用基于蚁群算法的信息SNP子集构造方法,设计了与信息SNP选择密切相关的基于预测精度的启发因子、路径选择以及自适应的信息素更新机制,提高了算法寻优的效率,从而提高了预测准确度。由于传统基于SVM的非信息SNP预测,需要多次循环以单体型中的非信息SNP。因此,本文为了提高预测阶段非信息SNP预测的准确度以及效率,充分利用ANN具有多输出节点的特点,并设计用于非信息SNP预测的输出函数,以提出基于人工神经网络的学习模型用以非信息SNP预测,从而可以做到一次训练即可对所有的非信息SNP位点进行预测。最后,为了便于其他生物信息处理研究人员有效利用本文的方法,基于VC6.0平台设计实现了一款可视化的信息SNP选择软件,该系统使用了本文提出的改进算法。本文利用该软件处理了多个模拟数据集以及真实数据集,并与其他方法在预测准确度以及运行时间上进行了比较,实验表明,本文的方法较当前主要信息SNP选择的算法,具有较优性能。
其他文献
随着网络的发展,互联网络规模快速膨胀、网络服务呈现多样化,使得现有网络体系在可控性和可信性方面受到严峻挑战,而不能有效控制网络资源造成网络传输质量难以满足用户需求是网
随着现在企业的信息化发展程度的逐步提升,其业务分支日益复杂,企业经营范围逐步向内销加外贸等商业模式转变,企业生产过程中,面临着跨地域、跨组织、跨行业、跨网络等实时信息化
自聚焦是非线性光学中最常见最基本的物理问题之一,从上世纪六十年代起,自聚焦就一直是非线性光学领域热门的研究课题。 从实践的角度来看,自聚焦效应限制了允许通过介
在传统的无线多跳网络中,由于节点移动、信号衰减、障碍物阻碍等原因,网络经常处于间断状态,源节点和目标节点之间大多时候无法建立‘条完整的端到端的路径,导致消息传输失败
  传统的信息检索方式由于其局限性成为了当今检索技术发展的桎梏,为了满足用户的需求,进一步的检索出语义层次的信息,知识检索应运而生。   知识检索主要包括语义检索和语
交互电子技术手册(简称IETM)就是将技术手册的内容转换为数字化,进行重新编制并以交互方式进行查阅通过计算机等设备把所查阅内容展现给维修技术人员或系统操作人员。在IETM的发
当下互联网技术迭代更新频繁,网络社交媒体更是呈现出蓬勃的发展态势,民众在互联网上发表意见的渠道得到了极大拓展,造成了网络信息资源的极速增长。网络信息资源通常以非结
互联网时代的到来,给人们生活带来了极大的方便,各种数字化多媒体产品都应时而生,如:图像、音频和视频等。由于人们的关注和热衷,网络的开放和共享,使得它们成为不法人士非法获取、
  运动目标检测是视频研究中的第一步也是重要的一步,运动目标检测已经被广泛应用于体育、医学、航空、视频监控、人类行为认知和视频检索等方面。人类的视觉系统对在静态和
随着互联网技术的飞速发展和云计算平台的兴起,云存储逐渐成为现代存储服务的提供方式,同时互联网规模爆炸式的增长,对网络服务器数据处理能力要求越来越高,服务器集群技术凭借其