【摘 要】
:
随着生物信息学的发展,各类生物数据井喷式出现,通过高效的算法来挖掘各类数据成为研究热点,从而衍生出基因组学、蛋白质组学、系统生物学等研究方向。利用计算方法对蛋白质网络中生物模块的提取和疾病系统的构建,有利于低成本地研究蛋白靶向关系和疾病机制。复杂网络中成熟的社区检测技术为蛋白网络的功能模块获取提供了研究基础,而且基于局部适应度的思想可以研究重叠属性的蛋白网络。基于蛋白质重叠复合物的功能模块挖掘和分
论文部分内容阅读
随着生物信息学的发展,各类生物数据井喷式出现,通过高效的算法来挖掘各类数据成为研究热点,从而衍生出基因组学、蛋白质组学、系统生物学等研究方向。利用计算方法对蛋白质网络中生物模块的提取和疾病系统的构建,有利于低成本地研究蛋白靶向关系和疾病机制。复杂网络中成熟的社区检测技术为蛋白网络的功能模块获取提供了研究基础,而且基于局部适应度的思想可以研究重叠属性的蛋白网络。基于蛋白质重叠复合物的功能模块挖掘和分析是生物信息学的一个重要内容。本文主要研究蛋白质复合物的检测和生物网络中重叠结构的分析,分别包括社区网络、蛋白质互作网络和疾病关联网络,研究内容如下:(1)针对传统的节点聚类和链接聚类在发现重叠社区方面存在的两种固有缺陷,即参数依赖和结果不稳定,本文提出了一种基于中心团的局部扩展改进算法CLEM(the local expansion method based on the centered clique),用以检测重叠社区。该算法通过选取中心团为核心种子,并在种子扩展过程中惩罚被多次删除的节点,从而改善所得结果的稳定性;通过选取不依赖参数的适应度函数,改进其迭代计算过程,从而避免了适应度函数的参数限制,并降低计算复杂度。在合成网络和现实网络上测试的结果表明:与已有算法相比,新算法在计算时间和准确度上均有很好的表现。(2)针对大型蛋白网络聚类成本高和网络噪声多的问题,本文提出了一种基于局部扩展的降噪方法LENRM(a noise reduction method based on local expansion)来挖掘蛋白质功能模块。该方法可以从大型的蛋白质-蛋白质相互作用(PPI)网络中发现重叠的蛋白质复合物。通过消除模块间的相互作用并模拟未发现的连接,我们的方法分别消除了PPI网络中大量的假阳性和假阴性噪声。通过在基准数据集上的测试,并与九种已知算法进行了比较,这表明该方法在复合物的数量和准确性方面均具有出色的性能。(3)为了有效整合不同类型的生物学数据来探索疾病机制,本文提出了一个新的框架,其中包括蛋白质-蛋白质网络,疾病-基因关联和疾病-复合物对,以将蛋白质复合物聚类并推断疾病关联。实际上,单一疾病通常是由多种基因产物引起的,例如蛋白质复合物,而不是单一基因。因此,从蛋白质-蛋白质相互作用网络中发现蛋白质群落并将其用于推断疾病-疾病关联具有重要意义。通过我们的方法发现的复合物在质量(Sn,PPV和ACC)和聚类数量方面优于三个PPI网络上的其他四种流行方法。系统分析表明,共享更多蛋白质复合物(例如葡萄糖和脂质代谢紊乱)的疾病对更加相似,重叠的蛋白质在不同疾病中的作用可能不同。这些发现可以为临床学者和医学从业者提供有关疾病识别和治疗的新思路。本研究课题的角度从一般性的复杂网络具体到特殊性的生物网络,探究如何在不同类型网络下进行聚类,尤其是在生物网络背景下重叠蛋白质复合物的提取。然后,依据蛋白质复合物与基因-疾病的关联构建了一个覆盖基因、蛋白质、表型和疾病的研究框架进行未知疾病关联的预测,构成一个完整的系统结构。
其他文献
灰狼优化算法(Grey Wolf Optimizer,GWO)是一种通过模仿自然界中灰狼群体的等级制度和捕食行为等过程以实现优化搜索目的的智能优化算法。与其他群体智能优化算法相比,灰狼优化算法有着原理简单、需要调整的参数少、易于实现等优点,因此灰狼算法受到了国内外研究学者的广泛关注。随着对灰狼优化算法研究的深入,学者们发现灰狼优化算法存在最终寻优结果精度较低、算法运行后期收敛速度较慢且容易陷入局部
近年来,以石墨烯和过渡金属硫族化合物(TMDCs)为代表的二维半导体材料因具有原子级厚度、高迁移率和带隙可调等优异的性能,备受研究者关注。然而,石墨烯的零带隙以及TMDCs的低迁移率却成为限制该类材料在光电探测领域应用的最大障碍。硒化铟(InSe)作为二维材料家族里的一员,具有优良的光学和电学特性,其室温下本征迁移率高达10~3cm~2V-1s-1,且随着层数的增加带隙从2.11e V过渡到1.2
目的:调查结直肠癌患者-配偶照顾者间的沟通现状及其影响因素;探讨治疗性沟通系统对结直肠癌夫妻间沟通的干预效果。方法:本研究包括描述性研究和类实验研究两个部分。描述性研究:于2020年1月至2020年11月采用便利抽样法选取无锡市某三甲医院肿瘤内外科143对结直肠癌患者及其配偶照顾者为研究对象,以一般资料调查问卷、癌症相关问题夫妻沟通量表(CRCP)、医院焦虑抑郁量表(HADS)、自我感受负担量表(
无线定位技术的发展伴随着不断优化定位算法提高定位精度的历程。经典算法的设计对定位场景设定了很多理想化的假设。实际的定位场景中存在普遍的障碍物、人群的活动以及非理想的信道环境,造成一系列的干扰误差。若这些干扰误差没有通过优化定位算法得到相应的处理,就会严重影响定位精度。衡量定位精度的主要指标之一是定位偏差。因此,本文主要研究低偏差无线定位算法的设计与实现。本文首先对定位系统中定位算法误差进行理论分析
织物,尤其是机织物,是日常生活以及产业应用中最为重要的材料之一,其结构参数主要包括经纬密度和织物组织,而色织物还涉及色纱排列以及配色模纹。这些参数的高效准确识别,是企业进行来样设计、质量控制的重要前提。然而目前,其分析仍旧依靠人工进行,耗时耗力且效率低下。近年来,利用计算机视觉技术自动识别织物结构参数的研究日益增多,然而仍未有十分成功的系统,这是由于目前的研究多是基于传统方法,而随着深度学习技术的
鸡群优化算法(Chicken Swarm Optimization,CSO)是2014年提出的智能优化算法,它模拟了鸡群中的等级秩序和鸡群的觅食行为。鸡群按一定的比例分为几组,每一组由一只公鸡、若干只母鸡和小鸡组成。在特定的等级秩序下,不同等级的鸡群之间存在竞争,同时也遵循不同的运动规律。鸡群优化算法具备结构清晰、易于理解、搜寻能力强的优点,因而受到了国内外学者普遍的关注。随着对鸡群优化算法探究的
二维半导体纳米材料因其较大的表面积和独特的电子性质而具有广泛的应用价值,并在过去的几十年里不断受到研究人员的青睐。研究人员发现二维材料在自旋电子学、光电子学、场效应管、探测器、传感器、量子器件、太阳能电池等众多科学领域均有着较大的应用价值。在进一步探索二维材料的新特性的进程中,超薄的二维范德瓦尔斯异质结构及其器件的研究受到青睐。这些不同二维材料以层间微弱的范德华力相互作用形成的范德瓦尔斯异质结显示
我国是一个农业大国,人口众多,资源匮乏,长期面临粮食短缺的压力。诸多类型的农业灾害制约着我国农业的发展,其中,农作物虫害为主要灾害之一。粘虫(Mythimna separata)是我国农田主要咀嚼式害虫之一,它为害时间长且范围广,严重损害了玉米、小麦、水稻等主要粮食作物的产量和品质。为了控制粘虫灾害,大量的化学农药不断投入使用。由于传统化学农药利用率低,极易流失到周围环境当中,对环境以及非靶向生物
认知无线电因可提高频谱利用率,在民用和军用领域得到广泛应用。在认知无线电系统中,如何有效识别已授权用户发送信号的调制类型,对频谱感知性能的提升有重要意义。且调制识别作为信号检测和信号解调的中间步骤,是保障可靠通信的关键技术之一。本文主要研究认知无线电系统中多种单载波数字调制信号的调制识别。首先,通过分析不同数字调制信号的高阶累积量理论值,可知在较少先验信息下,提取信号序列的二、四、六、八阶累积量对
藏药绿萝花在我国有着悠久的历史记载,根据本实验室之前的研究发现绿萝花水提物中含有29种物质,其中包括多酚、多糖和黄酮类,具有降低血糖,抗炎,调节肠道菌群的作用。前期实验表明绿萝花水提物具有改善2型糖尿病高血糖以及调节肠道菌群的作用,然而调节肠道菌群与改善糖代谢之间是否有因果关系,以及基于肠道菌群探讨绿萝花水提物对于2型糖尿病的作用机制尚未进行研究。因此,本实验在此基础上,以绿萝花水提物作为研究对象