论文部分内容阅读
复杂疾病的致病机理复杂,如果使用单种药物进行治疗,容易产生抗药性。药物组合治疗具有高效和低毒等特性,正在成为一种新的复杂疾病治疗手段。尽管人们开发了高通量药物组合筛选平台,但是进行药物组合实验所需的金钱和时间代价很大。因此需要一种算法帮助找到潜在的协同的药物组合,进一步的缩小药物组合实验范围。目前药物组合预测模型可以分为四类:基于表达数据的药物组合预测模型、基于PPI网络的药物组合预测模型、基于代谢路径的药物组合预测模型和基于药物相似性的机器学习药物组合预测模型。这些模型存在数据有偏、结果差和可用数据少等缺点。本文提出一种基于图表示学习的药物组合预测算法NEMNDC(Network Embedding framework in Multiplex Networks for Drug Combinations),改进了现有的基于药物相似性的机器学习药物组合预测模型。首先,通过部分的药物组合数据对每层药物相似性网络进行重要性评估;然后,使用二阶有偏随机游走进行网络采样,得到随机游走的路径,并根据路径生成训练模型所需的正负样本;随后,通过构建SkipGram模型学习药物节点的向量表示;最后,使用随机森林分类器进行药物组合预测。在药物组合预测任务上,本文评估了多层网络和单层网络对NEMNDC算法的影响,结果说明NEMNDC算法可以有效整合数据,并且对于每层网络的信息没有强的偏向性。使用NEMNDC算法预测的药物组合结果中,前6对未包含在已知药物组合数据集中的药物组合已经有5对被生物和临床实验验证是协同的药物组合。对另一对药物组合通过药物靶标、GO和Pathway分析,发现极有可能是协同的药物组合。本文还将NEMNDC算法应用在药物-药物关系预测任务上,通过比较INDI、PSL和Mashup算法,说明了NEMNDC算法在药物-药物关系预测上也很准确和适用。NEMNDC算法不仅解决了之前基于药物相似性的机器学习药物组合预测方法中存在的特征维度固定的问题,而且构建的药物节点向量中包含了多层网络的拓扑信息。本文提出的多层网络重要性评估策略可以更好地为多层网络数据整合工作提供指导。同时在药物-药物关系预测上使用NEMNDC算法得到很好的结果,说明其适用性,不仅仅适用于药物组合预测,也适用于药物-药物关系预测和药物重定位等。