【摘 要】
:
关键蛋白质是细胞生活重要物质基础,其缺失会使生物体致病甚至死亡。准确高效识别关键蛋白质可用于了解细胞功能,并且对药物设计提供极其重要的指导与思路。近年来,高通技术飞速发展,大量蛋白质相互作用(Protein-Protein Interaction,PPI)数据被挖掘出来,许多基于PPI网络的关键蛋白质识别方法被提出,这些方法大致分为两类:一类是基于网络拓扑特征,另一类是融合亚细胞定位等其他蛋白质生
论文部分内容阅读
关键蛋白质是细胞生活重要物质基础,其缺失会使生物体致病甚至死亡。准确高效识别关键蛋白质可用于了解细胞功能,并且对药物设计提供极其重要的指导与思路。近年来,高通技术飞速发展,大量蛋白质相互作用(Protein-Protein Interaction,PPI)数据被挖掘出来,许多基于PPI网络的关键蛋白质识别方法被提出,这些方法大致分为两类:一类是基于网络拓扑特征,另一类是融合亚细胞定位等其他蛋白质生物信息。蛋白质重要性不仅仅取决于它的拓扑特征,还包括能反映蛋白质生物特性的生物信息。所以,如何有效整合多元生物信息和网络拓扑信息提高识别率,仍是亟待解决的问题。针对以上问题,本文在深入分析网络拓扑以及生物特征的基础上,融合亚细胞定位等多源生物信息,提出两种不同的关键蛋白质识别方法。本文主要研究内容如下:(1)基于加权子网参与度的多数据源融合关键蛋白质识别针对现有关键蛋白质识别准确率有待提高的问题,提出一种高效关键蛋白质识别方法PDWS(Participation Degree of a Protein in Multiple Data Source Weighted Subnetwork)。首先,融合蛋白质亚细胞定位信息与边聚类系数,基于网络拓扑特征以及蛋白质所在亚细胞位置的重要程度,为PPI赋值权重;其次,在构建加权PPI网络上,提出亚细胞定位区室子网参与度与蛋白质复合物子网参与度指标,衡量蛋白质在网络中的重要性;最后,整合两个子网特征,设计一种关键蛋白质识别方法PDWS。实验结果表明,在DIP与Krogan两个数据集中,该方法识别精度中分别达到76%与73%,均高于其他方法。(2)基于局部功能密度的多源信息融合关键蛋白质识别针对现有识别关键蛋白质的方法并未充分考虑生物学信息,对低连通性的关键蛋白质识别效率不高的问题,提出新的关键蛋白质识别方法LFDI(Local Functional Density Via Multi-Source Information Fusion)。该方法在PDWS方法融合的两种生物信息基础上,通过整合GO注释与基因表达谱信息,提出了局部功能密度中心指标、蛋白质复合物参与度和亚细胞定位分数,以衡量蛋白质在网络中的重要性。为了验证LFDI的性能,在DIP和Krogan两个PPI数据集进行测试,实验结果表明,与最近的PCSD方法相比,LFDI方法可以识别部分具有低连通性的关键蛋白质,具有较高的识别率。本文针对现有关键蛋白质识别方法识别准确率有待提高的问题,提出了新的识别方法。第三章所提方法主要融合两种生物信息,利用构造加权子网内拓扑特征识别关键蛋白质,所以该方法对网络可靠性依赖性较低。第四章融合更多生物信息构造加权网络,提出局部功能密度作为一个评价指标,通过整合网络拓扑特性、子网拓扑特性以及仅利用生物信息计算的亚细胞分数三个指标评价蛋白质重要性,该方法对网络拓扑与生物信息考虑更加全面,在生物信息完善的网络中,可以使用该方法识别关键蛋白质。通过实验结果证实,所提两种方法在识别关键蛋白质方面具有有效性,且具有较高识别准确率。
其他文献
普通高中新课程的改革要求开展基于学生立场的建构学习、探究学习和问题解决学习,促进学生学习方式的转变,以便学生自我构建、不断提升自身的化学学科核心素养。而学历案是一种基于学生立场,强调学生自主构建或社会构建知识和经验的方案,符合新课改着力发展学生化学学科核心素养的要求。为落实学生立场的课堂教学,促进学生化学学科核心素养的发展,着重探讨了基于学科核心素养下高中化学学历案的设计与教学实践。首先对核心素养
现代社会高度依赖互联网,人们在享受着网络服务带来的便利性的同时,也面临着网络攻击带来的威胁。低速率拒绝服务(Low-Rate Denial of Service,LDoS)攻击是一种新型的网络攻击方式,具有隐蔽性强、攻击速率低和检测难度大等特点。软件定义网络(Software Defined Network,SDN)作为下一代网络的热门解决方案,解耦了数据平面和控制平面,采用软件定义的方式对网络进
基于全球化、信息化和我国当前课程改革的背景下。要求人们能够创造性地运用知识与技能来解决实际生活中所发生的问题,在各种复杂的信息和智能化环境中有效迁移处理、解决问题,需要人们具备高阶思维能力,同时也是落实核心素养的具体体现。高阶思维能力是一个人以创新能力和批判性思维能力为核心,进行问题解决的高层次认知活动过程中所表现的综合能力。界定高阶思维能力主要由问题解决能力、批判性思维能力和创新能力构成。由此,
命名实体识别是自然语言处理的一项基础任务,其目的是识别文本数据中人名、地名、机构名等类型的实体。命名实体识别效果对后续的关系抽取、机器翻译、知识图谱等任务有很大影响。近年来,深度学习被广泛用于命名实体识别任务,并取得了很好的效果。然而,现有的深度学习方法大多为有监督的训练方法,在特定领域命名实体识别任务中,由于缺乏标注数据,使得依赖大量标注数据的深度学习模型难以取得优异的性能。本文从半监督集成学习
高中物理教师的教学工作不可能尽善尽美,均会存在不足,这就需要教师不断地进行教学反思,但是大部分教师在教学反思时有一定的主观性和局限性。学生错题作为一种宝贵的教学资源不仅反映了学生的学习情况,还暴露了教师教学的不足之处,可以帮助教师进行教学反思,这就需要教师对学生的错题进行管理,因此建立易错题集作为教师对学生错题管理的有效途径可以有效地指导教师的教学反思。该研究首先介绍了相关研究背景和现状,给出了核
“审美”是音乐教育的核心本质,我国高中音乐学科无论是从课程理念还是音乐教材都一贯体现着“审美”的核心理念。本文以2004年我国教育部出台的《普通高中音乐课程标准(实验)》和2017年《普通音乐课程标准(2017年版)》为指导目标,对课程标准提出的“审美”理念,以人民音乐出版社和湖南文艺出版社出版的高中《音乐鉴赏》教材为例,进行初浅的研究和比较分析。本论文采用了文献分析法、比较研究法、调查研究法和实
多目标跟踪因为其重要的学术价值和非凡的商业潜力,在计算机视觉领域备受关注,例如在自动驾驶、航空航天、医疗诊断、智能监控等众多领域得到了广泛的应用。在最近的十几年中,研究人员已经提出了大量的创新算法来研究这个课题,多目标跟踪的技术取得了很大的发展,但在面临诸如目标重叠、外观剧变、光照变换、身份跳变等问题时,仍然存在着重大挑战。本文旨在从多目标跟踪中的数据关联出发,利用行人重识别技术,分别与多假设跟踪
当标注数据充足的情况下,现有的文本分类方法已经可以取得比较好的效果。近来基于深度学习的文本分类方法的发展,已经使得文本分类任务的性能达到了工业界的应用要求,特别是基于预训练+微调的两阶段文本分类方法,更是将文本分类的效果推上了一个前所未有的高度。但文本分类效果提升的同时,模型的复杂度也在迅速的增加,对标注数据集的规模以及质量的要求也在不断提高,使得应用场景很是受限。在实际应用中文本分类任务的训练数
深度学习方法在图像分类任务中取得了巨大成功,然而深度神经网络模型的优异表现高度依赖海量的标签样本数据。当样本数量较少时,模型训练受到限制,易发生过拟合现象且泛化性能差。在实际应用中,海量标签样本的获取往往十分困难。因此,如何高效利用深度学习模型解决小样本图像分类问题具有重要意义。深度度量方法旨在学习一高效度量空间,有效完成输入特征的非线性映射,准确反映样本间相似程度。针对极端的小样本图像分类任务,
本文文言文同义动词的选择范围为2007年3月第2版人民教育出版社出版的《普通高中课程标准语文实验教科书(必修)》。文章从课程标准、教科书课后习题以及一线教师访谈出发分析当前的文言文同义动词教学现状与问题。从教材中挑选出16组常见同义动词,在学习和吸收之前学者的经验成果上,分析词组内部成员之间的异同,再结合教学需要探讨高中文言文同义动词教学策略,也期待为今后的语文教学提供可靠性意见。本文除绪论和结语