基于图神经网络的蛋白质-配体分子间结合亲和力预测

来源 :安徽大学 | 被引量 : 0次 | 上传用户:adamas522
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质配体分子间的相互作用经常发生在许多基础生物活动过程中,了解蛋白质-配体的相互作用对于了解许多生物系统和辅助药物开发工作意义重大。对其定量研究的方式为分子间结合亲和力的测定。传统的生物化学实验或基于物理学第一性原理的计算测定方法固然较为准确,但获得相应结果需要付出较高的时间或劳动力成本,不适合分子筛选的大规模工业应用。而计算方法在实用性和可负担性中追求平衡,允许对小分子化学空间进行广泛探索。因此,对蛋白质配体分子间结合亲和力的计算方法进行研究非常有必要。过去几十年,研究者在蛋白质-配体结合亲和力的计算领域中积累了非常多有效经验,提出了很多种计算方法,但依然存在一些不足。其中,基于机器学习和深度学习的方法在预测准确度方面脱颖而出。但机器学习方法依赖于手工特征工程,而目前还难以找到普遍适合整个化学小分子空间的特征工程方法。深度学习方法通过复杂神经网络的端到端学习为这项研究提供了一种新思路,此类研究目前主要集中在不同分子编码方法结合不同卷积神经网络模型这种方式上,这些方法的预测效果高于传统打分函数和机器学习方法,但在预测准确度上还有一定的提升空间。鉴于新兴的图神经网络在其它领域已经表现出杰出的学习能力,其以图结构表示数据的方式非常适合于表示分子且它在蛋白质-配体结合亲和力领域中研究较少。本文的研究就图神经网络在蛋白质-配体分子间结合亲和力预测中的应用开展研究,提出了两种基于图神经网络的蛋白质-配体分子间结合亲和力预测方法:1.从蛋白质和配体分子的结构出发,提出了一种名为APMNet的级联图卷积神经网络方法。该方法将分子看作图数据结构,通过将两种可以处理非欧式空间数据的不同图卷积神经网络(ARMA图卷积和MPNN图卷积)级联的方式,利用两种不同图卷积神经网络各自的优势,分阶段提取隐藏在分子结构中的与结合亲和力有关的特征,完成对蛋白质配体分子间结合亲和力的预测。实验结果表明,APMNet取得了很好的预测效果,在PDBBind数据集上相关性指标Pearson R达到了0.815,误差指标RMSE为1.268。2.针对目前还存在的大量已知氨基酸序列但结构仍未被解析的蛋白质分子,提出了一种融合配体分子图结构信息和蛋白质氨基酸序列信息的方法SGNet。通过图注意力神经网络来学习获得配体的分子表示,一维卷积神经网络来学习经CT(Conjoint Triad)初始编码的蛋白质氨基酸序列的分子表示,通过全连接层融合二者的特征,从而预测出该分子对间的结合亲和力。并在更严格的基于相似性聚类的新配体、新蛋白质和新蛋白质配体分子对的三种交叉验证策略下考察了SGNet模型的泛化性能。实验结果表明,SGNet预测出的结合亲和力与真实标签相比误差很小,与现有方法相比,准确度更高。本文提出了两种蛋白质-配体分子间结合亲和力计算方法,分别针对已知结构的蛋白质和未知结构的蛋白质氨基酸序列,与现有的计算方法相比,计算准确度均更有优势。本文的研究内容可以为药物设计和发现早期阶段提供一定指导。
其他文献
研究脂滴与其他细胞器的相互作用对于深入了解LDs的生理和病理机制具有重要意义。尽管商用的LDs探针已经被开发,但由于其两亲性,内质网和其他膜结构也会被染色,这限制了它们的进一步应用。为了解决这个问题,本文报道了一种高度疏水的荧光探针,以高信噪比特异性地标记细胞内LDs,避免了ER的不良染色,从而实现了实时监测LDs与其他细胞器之间的相互作用。该探针在脂质环境中有较强的发射,在水和脂质体中无明显荧光
有机荧光探针因其具有结构多样、检测结果直观可见、不仅可以定性分析,也可以实现定量分析,常常被应用到微环境的检测方面,如生物离子、氨基酸小分子、蛋白分子、细胞粘度、p H等的检测。其中离子在生物体内的水平对于维持细胞稳态和生理机制的正常运行具有非常重要的作用,当离子的浓度过高或过低时,细胞环境无法正常调节,造成细胞环境紊乱甚至死亡,从而引发出各种生理疾病。因此开发更加简单高效的能检测微环境中的离子水
在团簇领域里面,某些具有特定大小的团簇可以模仿元素周期表中的一个原子或一系列原子的化学行为,我们把这类团簇叫做超原子。并且因其具有独特的理化性质,近些年以来在学术领域内引起了广大学者的研究热潮,给团簇领域的发展带来了新的活力。只有对这些超原子的特性进行分析,了解其本质特征,我们才能有效的将这些超原子团簇扩展到元素周期表的第三维。同样团簇也可以作为组装材料的基本构建单元,可以在理论上将团簇的性质合并
光功能配合物材料具有可设计性强、稳定性高、发光波段可调、光物理性质优异等优势,在信息、能源和生命科学等领域中扮演着重要的角色,备受科研人员的青睐。咔唑作为一种典型的长寿命蓝光发射材料,通过进一步修饰,可构建一类具有平面性好、电子离域度高、发光寿命长等特点的有机配体。本文以咔唑基三联吡啶衍生物为配体,以Zn,Eu,Gd和Yb为中心,设计合成了 一系列配合物,系统研究了光物理性质,探索了其在细胞成像领
稀土-过渡金属配合物虽然已不再是一个新兴学科,但研究者们对高核稀土-过渡金属簇合物的研究热情依旧不减。从最初报道出具有漂亮接近完美结构的高核稀土-过渡金属簇合物(如开普勒构型的Ln20Ni30,俄罗斯套娃构型的Ln54Ni54和Ln60Ni76),到后期对其在光、电、磁、催化等领域性质的探索及推广,以及最近在组装机理方面的研究报道,足以说明高核稀土-过渡金属簇合物仍是一个有趣且值得探索的研究领域。
水文条件是浅水通江湖泊维持其生态系统服务功能的基础,一个合理的水位调控方案对湖泊野生动物的栖息地管理有着重要意义。升金湖作为长江中下游典型的浅水通江湖泊,为越冬迁徙水鸟提供充足的栖息地。黄湓闸的修建改变了湖泊原有的水文节律,对水鸟造成了不利的影响。本文以水鸟栖息地为关注点,探究在不同的水文条件下,水位调控制度对每类水鸟取食集团丰度的影响。首先,通过长时间序列(2008–2019年)连续模拟建立水位
人们通过改变后过渡金属催化剂结构来达到修饰聚合物的目的,我们在前人研究基础上通过在配体的N-芳基引入大位阻取代基,从而降低催化剂顺反异构之间转换速度。当相互转换速度足够低时,我们可以近似认为得到了单一的,结构不对称的催化剂,这种拥有不对称结构的后过渡金属催化剂在催化性能上有着优异的表现。我们通过以下工作对这类催化剂展开了深入研究。在第二章节中,我们进一步证明了在乙烯与α-二亚胺镍和钯的聚合反应中,
原子精确的金属纳米团簇因其超小的尺寸和可控的结构,而具有与宏观物质不同的性质,逐渐成为近几年的研究热点。因为尺寸超小,所以与等离子激元金属纳米粒子的连续能带性质不同,而是显示出分子的特性。尤其是那些尺寸大小接近但核(或表面)结构不同的纳米团簇提供了独特的机会,让研究者们可以在不受尺寸影响的情况下探究核和表面结构之间的关系。对纳米团簇结构的研究发现,可以把团簇看成是由不同结构单元(如Au4、Au11
中子辐射广泛应用于农业育种、国防军事、放射治疗及核工业等领域。研究表明作为高传能线密度(Linear Energy Transfer,LET)射线,中子辐射可引起严重的生物学效应。近年来,大量研究表明低LET辐射可诱导细胞产生低剂量辐射超敏感(Low Dose Hyper-radiosensitivity,HRS)反应。随着中子辐射的广泛应用,低剂量中子辐射是否会引起该反应仍需研究。本论文利用强流
锹甲(Lucanidae)作为鞘翅目(Coleoptera)金龟总科(Scarabaeoidae)中一种常见的腐栖类(Saprophytic)甲虫。幼虫栖身于腐烂的木头或泥土中,通过分解朽木、腐殖质获得生长发育的营养物质,成虫则以树汁、花蜜和腐烂的果实为食。它们对栖息地的要求十分严格,对气候的变迁和森林生态系统的环境变化非常敏感,因而有助于维持生态系统的动态平衡,也可以作为森林生态系统健康状况的指