论文部分内容阅读
当前大量的公开数据库中已经积累了海量的小分子数据,其中包括药物相互作用数据、小分子的化学结构数据等,因此需要各种方法来挖掘这些数据中所包含的有用信息。本研究提出了两种小分子信息挖掘方法,这两种方法可以被应用于相关的医药研究。第一种方法利用了药物相互作用数据进行药物再利用的相关研究,而第二种方法利用了小分子的化学结构数据来预测癌症发生的相关蛋白。1.基于药物相互作用数据的药物再利用。由于传统的药物研发方式花费的时间很长,而且具有较高的风险,所以药物再利用(将现有药物用于治疗另外的疾病)得到了越来越多的关注。尽管已有许多类型的药物信息被用于药物再利用的相关研究,但是药物相互作用数据仍然没有得到有效利用,而这些数据中可能包含了药物的靶标或者生理效应的信息。在本研究中,药物在药物相互作用方面的相似性被用来推测药物在靶标或者生理效应方面的相似性。首先从数据库中收集了关于1074种药物的10835对药物相互作用,然后计算了其中700种药物之间的基于药物相互作用数据的相似性打分,并且将这些相似性打分转化成一个药物关联网络。该网络包含589个节点(药物)和2375条边(相似性打分),其中具有相似功能的药物倾向于聚集在一起,这表明药物相互作用与药物的生理效应之间具有显著的相关性。因此,该网络能够被用于推测药物的生理效应。然后本研究评价了该网络预测药物靶标的能力。结果表明该靶标预测方法对561种药物中的317种有效。最后将基于药物相互作用数据的靶标预测方法与基于药物化学结构的靶标预测方法进行了比较,发现这两种方法互为补充。综上所述,药物相互作用数据可以被用于药物再利用的相关研究。2.利用化学信息学预测癌症发生的相关蛋白。癌症给人类造成了沉重的负担。传统的癌症治疗方法有非常大的副作用,所以迫切需要开发出新的专一作用于肿瘤的分子靶向药物。而癌症发生的分子机制的阐明能够很大程度地促进相关药物的研发。因此,癌症相关蛋白的识别具有非常重要的意义。本研究尝试从一种新的角度对癌症相关蛋白进行预测。其利用化学信息学方法分析了已有的生物活性数据库中抗癌化合物与各种蛋白质对应的活性化合物之间的关系,从而找出癌症与这些蛋白质之间可能存在的联系。通过对最终预测得到的癌症相关蛋白的列表进行分析,发现该化学信息学方法具有较好的预测能力。根据检索到的文献报道,在排名最高的前31种蛋白质中,约一半与癌细胞的增殖、凋亡或分化相关。另外,在癌症相关蛋白的预测过程中,还产生了一个化合物-蛋白质矩阵。该矩阵由K-562癌细胞系的3160个活性化合物与进行预测的所有蛋白质所形成,包含了这些化合物与蛋白质之间可能的相互作用信息。这些信息对于药物发现有一定的作用。本研究表明化学信息学在癌症相关蛋白的预测中具有较好的应用前景,可以帮助揭示癌症发生的分子机制。