基于机器学习的蛋白质复合体精确识别研究

来源 :福州大学 | 被引量 : 0次 | 上传用户:OsWorkFlow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人类的基因测序计划宣告完成的背景下,生命科学领域正逐渐把研究重点转向蛋白质范畴。近年来,随着机器学习算法研究的热潮,其在各个领域的应用备受关注,蛋白质组学领域也深受影响。由于PPI网络的不停壮大,内容逐渐完善,一个海量数据以及高复杂性的PPI网络对相关工作提出了挑战。目前,对于PPIN复合体的识别研究主要以聚类算法的应用为主。通过研究发现这些算法策略在不同程度上都存在着局限性。因此,本课题基于对当前蛋白质网络聚类问题中存在的问题,提出了基于改进PSO算法——KPSO算法的蛋白质网络复合体检测算法研究。本课题针对PPIN聚类中的算法速度及检测精确度等问题,进行了相关的调查、研究、实验和分析,基于改进粒子群算法,融合拓扑结构、功能注释以及生物进化等信息到蛋白质模块的检测中,具有重要的学术意义。具体描述如下:(1)分析和比较几种解决策略在PPIN聚类上的性能优缺点目前,应用在PPIN聚类上的算法五花八门,种类繁多。但是,随着蛋白质网络的发掘,其复杂性,规模的不断变化,导致一些算法并不适合或是对该问题的解决效果不好。本文将对几种常见的解决策略进行介绍、分析和比较,总结各个策略的优缺点。希望从中可以得到借鉴,为本文的策略提供有价值的参考。(2)探讨PPIN功能模块聚类研究中需要关注的问题当前,聚类算法在PPIN的功能模块检测上已取得了一些显著成果。但是,聚类算法是一种主观性很强的研究方法,并且由于计算机领域的研究者对生物领域知识的掌握不足,往往容易忽视蛋白质数据的生物特性,导致聚类结果的不合理性。因此,本文对于在蛋白质相互作用网络聚类过程中需要注意的问题进行探讨,如算法的选择、数据的获取和处理、相似度的定义、网络的建模以及算法参数的设置等。(3)提出一种高效、稳定、准确的PPIN聚类策略通过对已有算法的研究和比较分析,以及对算法选择、数据获取和处理、相似度定义等问题的探讨,提出一种高效,鲁棒性高的PPIN检测策略,克服当前算法存在的不足。并对给出的检测策略进行基本原理概述、过程介绍和实验验证。
其他文献
有机-无机杂化半导体材料是一种新型的复合功能材料,它结合了有机半导体材料结构多样性和无机半导体材料高载流子迁移率的优点,在光电、传感器、光学、照明、能量转移等领域
GH4169合金是一种沉淀硬化型镍基变形高温合金,广泛应用于航空、航海、化工等重要领域。随着GH4169合金应用领域的不断拓展,对合金的高温力学性能、耐腐蚀性能等综合性能要求
随着信息技术的高速发展,微波介质陶瓷凭借高介电常数、高品质因数和近零的谐振频率温度系数等优点,被广泛的应用于微波传输、电子对抗等领域。科学技术发展对电子元器件集成
中国是世界上最大的蔬菜生产国和消费国。在经济领域当中,蔬菜是竞争比较充分的产业。大城市的蔬菜产业是一项重要的经济产业,大城市蔬菜生产的经济效益明显高于农村地区粮食
煤矿瓦斯爆炸事故是煤矿重大灾害之一,瓦斯爆炸事故会造成大量的人员伤亡和生产系统破坏。合理的阻隔爆技术及装备,能够有效地减弱瓦斯爆炸事故的能量,降低破坏能力,减小波及
在社会的发展进程中,推动社会进步、民众富裕、国家富强的重要力量是人才,当代国家之间竞争也由原来以经济、军事为主的竞争演变成人才为主的竞争。在企业之间的相互竞争中,已经
氧化锌(ZnO)是一种宽禁带半导体,具有机电耦合性能良好、激子束缚能高等特点,而且ZnO原料易得,成本低且无毒。这些优异性能使其在气敏和压敏原件、压电器件、太阳能电池、薄
在我们真实的世界里存在着大量的复杂网络。节点代表研究对象,节点间存在着各式各样的联系即边。以微博、Twitter为代表的社会媒体平台中的社会网络就是真实社会中复杂网络结
Cu纳米颗粒是有高活性和选择性的催化剂,具有比表面积大、表面活性位点多等优点,被用来催化对硝基苯酚。不同形貌的Cu微/纳米晶体,如立方体、线状、盘状、枝状、以及中空结构
半导体界面电子结构(主要涉及能级位置、禁带宽度等)以及化学结构(主要涉及化学键、原子周围化学环境等)对半导体器件性能有显著影响。X射线光谱学不但可以表征材料的化学结