【摘 要】
:
了解蛋白质的亚细胞位置对于理解蛋白质的功能,蛋白质间的相互作用,药物的靶向治疗具有重要的意义。然而目前利用实验检验的方法来获取蛋白质的亚细胞位置需要耗费很大的成本
论文部分内容阅读
了解蛋白质的亚细胞位置对于理解蛋白质的功能,蛋白质间的相互作用,药物的靶向治疗具有重要的意义。然而目前利用实验检验的方法来获取蛋白质的亚细胞位置需要耗费很大的成本和时间。因此利用蛋白质亚细胞位置预测工具来对大量的蛋白质进行预测具有重要意义。目前,领域内已经提出了一系列机器学习算法来构建模型,达到预测大规模蛋白质的亚细胞位置的目的。这些分类器关键步骤是将氨基酸序列编码成为特征向量。许多研究已经表明从生物学家所注释的生物域提取的特征,例如基因本体论特征和功能域特征,可以非常有效的提高预测准确性。然而,这些生物注释特征和功能域特征通常拥有很高的维度和大量的冗余,这可能会降低机器学习模型的性能。另外蛋白质可以同时存在于两个或更多个不同的亚细胞位置,而目前对于多亚细胞位置蛋白质的预测效果往往不是十分理想。在本篇论文中,我们提出一种新的基于氨基酸序列的人类蛋白质亚细胞定位预测方法,我们将它命名为Hum-mPLoc 3.0,在该方法中我们对12个人类亚细胞位置进行预测。我们将该蛋白质序列用不同方面的特征表示,即基因本体论(GO)注释特征,基于肽的功能结构域和基于残基的统计特征。为了系统地反映领域知识库的层次结构,我们提出一种称为HCM(隐相关性建模)的特征表示模型,其将通过对注释特征之间的隐藏的相关性建模来创建出更紧凑和更有区别性的特征向量。我们在四个数据集上与领域内其他的预测器进行了比较,实验结果表明,我们的方法能够最有效的预测人类蛋白质的亚细胞位置。同时,Hum-mPLoc 3.0对在Swiss-Prot数据库上的整个人类蛋白质组的进行了大规模应用揭示了细胞中的蛋白质共亚细胞定位偏好。
其他文献
真菌在自然界中广泛存在,人类每天吸入成百上千的曲霉孢子,多数人可以检测到白色念珠菌的感染,同时其他的一些真菌物种也存在于我们的日常生活中,因此我们将接触数百种可能具
BET抑制剂是一类靶向含有溴结构域蛋白的小分子抑制剂。目前,BET抑制剂作为一种新型的抗癌药物,正在进行临床试验。在本研究中,我们发现,新型BET抑制剂OTX015不仅仅能够抑制
目的:观察玻璃体腔注射雷珠单抗和康柏西普治疗视网膜黄斑小分支静脉阻塞(macular branchrtinal vein occlusion,MBRVO)继发黄斑水肿(macular edema,ME)的临床疗效,包含术后
海岸(沿海低地)地区是人口聚集区,也是经济活动密集的区域。海岸带环境的脆弱性直接影响到人类和经济的安全。陆源物质在海岸带地区的堆积过程演化会影响海岸的建造及海岸带地貌。本文研究区位于下辽河平原大凌河与辽河之间区域,近百年来沉积区沉积过程主要受大凌河、辽河和绕阳河控制。为探讨沉积物来源以及沉积演化过程,本研究利用采自大凌河—辽河三角洲平原的7个沉积柱状岩心和17个河流表层样,开展了详细的粘土矿物分析
研究背景胶质瘤是最常见的脑部恶性肿瘤,由于胶质瘤细胞无限生长,预后差,胶质瘤患者术后经常需要放疗和化疗。DC517是一种新型的特异性非核苷类DNMT1抑制剂,对DNMT1有显著的
目的探究醌型二氢生物喋呤还原酶(Quinoid dihydropteridine reductase,QDPR)是否可以通过调控凋亡,进而影响输尿管梗阻(unilateral ureteral obstruction,UUO)诱导的肾间质
目的重症医学科(Intensive care unit,ICU)中的机械通气患者在自主呼吸试验(Spontaneous breathing trial,SBT)过程中,通过超声监测患者膈肌位移及下腔静脉变异度,并与呼吸浅
研究目的:探讨全身振动(whole-body vibration,WBV)训练联合髋膝肌强化训练在改善成人髌股疼痛综合征(patellofemoral pain syndrome,PFPS)患者的疗效。研究方法:本研究共招
目的:探讨腹腔热灌注化疗在腹腔镜胃癌D2根治术后应用的安全性。方法:选取2018年9月至2019年10月收治的80例进展期胃腺癌病例为研究对象,按照随机数字法分为治疗组(n=44)与对照
目的:通过测定中性粒细胞/淋巴细胞比值(NLR)和血小板/淋巴细胞比值(PLR)的变化,探讨阻塞性睡眠呼吸暂停综合征(OSAS)导致高血压发生的机制。方法:本研究回顾性分析2018年7月