多示例多标签学习在基因功能注释中的应用

来源 :湖南大学 | 被引量 : 0次 | 上传用户:sunshu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在后基因组时代,最主要的挑战是基因组注释。作为基因组注释的重要研究部分,基因功能注释有着举足轻重的地位。为人类更好的认识基因,探索生命的本源提供必要的依据。人类基因组测序工程产生了大量的全基因组数据,这些数据为基因功能注释课题的研究提供了丰富的生物学信息。然而,从大量的信息中获取有用的知识,人工的方法已经不能胜任,需借助计算的方法进行机器学习。本文采用多示例多标签的学习方法对该任务进行研究,主要的研究工作如下:首先,本文从基因表达模式的角度对基因功能进行预测,细致地分析研究了基因功能注释数据库中基因功能之间的关系及其推导过程。针对基因功能注释数据库中基因与功能之间多对多映射关系的特点,本文引入多示例多标签学习框架,并对多示例多标签学习框架进行研究分析。其次,针对多示例多标签学习框架的退化策略会退去基因之间的相关性的问题,本文结合多示例学习框架与层次聚类算法,提出了多示例层次聚类算法。该算法以基因表达相关性为基础,将拥有相同基因功能的基因的时序表达数据子集视为该基因功能的示例集合进行多示例构建。使用基因时序表达数据之间的皮尔森相关系数计算多示例之间的距离,并通过最大化各基因功能类中所包含的基因之间的相关性进行聚类约束,使得基因之间的相关性能在聚类过程中得到很好的保持。最后,为验证算法的有效性,本文在酿酒酵母的四个基因时序表达谱中进行实验,先使用多示例层次聚类算法将多示例多标签任务退化成单示例多标签任务,再采用多标签支持向量机或多标签K近邻算法进行求解。实验表明该算法能在多示例多标签学习框架的退化过程中很好的保持着基因之间的相关性,并拥有着良好的性能。
其他文献
期权是目前最典型的、最具有研究价值和最重要的金融衍生工具,对期权的定价研究不仅具有理论意义又有实际应用价值。然而随着金融市场的蓬勃发展和期权及其相关理论的不断完
负刚度系统在工程实际中比较少见,但其以承载能力大、变形小、可控性能好、固有频率低等优点成为了广大学者的研究热点。在受控系统上应用动力吸振器(DVA)是减振方向的有效举
目前,我国220k V双分裂线路的布置方式普遍采用的是垂直排列,但在电磁力的作用,220k V垂直双分裂导线子导线产生相互的吸引力,在一定的条件下将发生上下粘连和摩擦,导致导线
克拉玛依油田九4区齐古组油藏底水发育,油层与底部水层之间没有明显隔夹层,在油藏蒸汽驱开发过程中随着底水的不断锥进,油层底部层段和锥体部分形成大孔道,区块综合含水上升
随着信息时代的到来,数码相机和手机几乎成为人们生活中不可缺少的一部分,人们随时随地都可以拍出一幅图像,这就导致图像数量呈爆炸式增长的趋势。那么,摆在人们眼前的一个急
研究目的课题组大量研究表明KP-4具有心肌保护能力,我们前期研究也发现KP-4保护心肌缺血,并且发现其促进血管新生。为了进一步提高心肌保护活性,本课题组前期以KP-4为先导化合物合成了一系列衍生物,最终筛选出安全性更高、药效更强的KFH-08,并且发现其心肌保护作用依赖于VEGF信号通路。鉴于VEGF信号通路和血管新生的密切关系,我们猜测KFH-08同样具有促血管新生活性。因此,在本研究中,我们将
随着计算机和网络技术的飞速发展,数据库中的应用与共享越来越广泛,这将会带来重要数据隐私信息的泄露。很多研究者开展了相关方面的探究,形成了一系列的匿名规则来保护隐私
目的:探索解偶联蛋白-2(Uncouplingprotein-2,UCP-2)在胃癌临床筛查中的意义,并探索该蛋白与胃癌的分期及胃癌细胞分级(分化程度)是否相关,从而间接了解其是否与胃癌的远期预
随着社会与经济稳步快速的发展,人才培养的速度与质量成为了教育的重要目标,学习效率的提升也成为了学校教育的一个重要追求。学习动机作为一种内驱力,可有效的提升学生在学
自治区旅游发展大会召开以来,在“一带一路”和“旅游兴疆”战略下,新疆旅游业呈现出高质量和快速发展的态势。旅游消费者作为旅游行业发展的动力来源,在新疆旅游经济发展中扮演着重要角色,对实现旅游经济收入发挥着举足轻重的作用。然而从新疆旅游行政执法与处罚的相关数据来看,近几年来旅游消费者合法权益遭受侵犯的现象仍然存在,导致新疆旅游消费者对新疆旅游的整体满意度并不高,因此为了实现新疆旅游经济的持续发展,依法