基于多组学生物异构网络的药物重定位方法研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:liangmingming
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
全新药物的研发存在着高投入、高风险以及费时耗力等问题。在一种新药被发现到批准上市的过程中,依次需要经历分子探索、动物实验、临床试验等多个环节,平均需投入10到15年的时间和约8亿美元的成本,而且成功率极低。药物重定位,亦称老药新用,是指发掘已上市药物的新适应症或新用途,能够显著缩短药物研发周期,节约制药成本并规避风险,逐渐成为药物研发的重要策略。药物重定位计算分析的主要方法,按照技术策略可以大致总结为药物-靶标关联预测、药物-疾病关联预测和药物-药物关联预测等,本文主要针对药物-靶标关联预测和药物-疾病关联预测两种策略建立模型,基于异构网络的链接预测算法,实现药物重定位。具体地,本文完成了以下三方面的工作和创新:(1)近年来,生物信息学、系统生物学、深度学习和大数据等技术发展迅速,海量药物、疾病、靶标等生物数据的积累提供了丰富的生物学特征,本文通过整合15种化学、基因组、表型和细胞等网络构建出一个多组学生物异构网络。为了学习不同网络的深层表征,本文运用多层深度自编码网络学习每种网络中节点的低维向量表示,考虑到生物数据典型的正负样本不平衡问题,本文引入偏置矩阵补全算法寻找药物空间到靶标空间的最佳映射。(2)大多数模型在学习网络节点表示时只考虑到节点邻居之间二阶以内的邻近度,研究表明,节点之间的高阶邻近度对于捕获网络底层拓扑结构具有很高的重要性。本文基于任意邻近度保留算法学习15种网络中节点的低维向量表示,从而能够保留节点任意邻近度的特征,接着再使用高分类精度的树模型完成链接预测。具体地,本文将药物-靶标链接预测问题转化为机器学习中的二分类问题,并使用深度森林算法进行分类。(3)在第一项工作中使用多层深度自编码网络分别提取每种网络的特征,没有考虑到不同网络之间信息的关联,在整合所有网络特征时可能存在信息丢失。借鉴于多模态学习的思维,本文改进使用多模态深度自编码网络用于不同药物网络的特征提取和融合,从而学习到一个高质的和所有网络都相关的特征表示。接着使用协同变分自编码网络将药物-疾病链接预测问题转化为推荐系统问题,对不同疾病推荐预测得分较高的药物。
其他文献
福尔马林固定石蜡包埋(Formalin-fixed paraffin-embedded,FFPE)组织含有大量疾病相关信息,是回顾性研究最常见的材料。由于FFPE的制作方式,从FFPE组织提取的DNA质量差,检测时常出现C:G>T:A假突变。在基于LNA或PNA等具有压制效果的检测方法中,假突变出现频率更高。本论文以消除压制体系检测FFPE标本时出现的假突变为研究目的,使用Cod UNG酶修复结合
小团簇在催化领域备受关注,众所周知,催化剂的活性、选择性和稳定性与催化剂的尺寸、形状、载体和周围环境等密切相关。然而,重要问题是:在理论计算研究中,通常采用静态结构优化的方法,以静态的眼光研究催化反应。这是由于在基元反应发生的时间尺度,催化剂可以被认为是固定不变的。但是当催化剂的尺寸减小到一定程度,其动态效应越来越显著。那么,在真实的催化环境下,像团簇基这种纳米级别的催化剂会发生什么?在催化过程中
滑坡是一种滑移地质现象,发生时会摧毁建筑物、阻塞河道、破坏道路以及农业机械设施和水利水电设施,对人类生产、生活构成巨大威胁。由于特殊的地形地貌、气候条件影响,我国是世界上发生滑坡灾害最频繁的国家之一,因此加大对滑坡的监测力度是非常有必要的。常规的滑坡监测方法有诸多局限,如监测密度低、监测范围小、无法持续实时监测等。合成孔径雷达干涉测量(InSAR)作为一种新兴遥感技术,可以获取大面积、连续的地表形
墨脱县位于西藏自治区东南部,雅鲁藏布江中下游,大致位于北纬27°34ˊ~29°56ˊ,东经93°46~96°05ˊ之间,面积3.4万平方公里。该地区位于喜马拉雅山东段南麓,属喜马拉雅山东侧亚热带湿润气候区,在南部有茂盛的热带雨林、亚热带季雨林。墨脱整体地势陡峭,从南迦巴瓦峰顶到谷底,有着世界上最大的地形转折变化,垂直地带性明显。墨脱野生动植物资源极其丰富,有“世界动植物博物馆”、“世界生物基因库”
平遥盲书说唱队指具有一定水准的平遥盲书奏唱者。他们是非物质文化遗产平遥盲书在历史长河中存活、发展的见证者,也是使平遥盲书源远流长、得以发展至今的关键角色。没有人类的思考、表演和创造,音乐就无法存在,我们不仅要理解作为构造性声音的音乐,还有理解作为人类行为的音乐,因此本文立足于音乐人类学研究视角,以平遥盲书说唱队为研究对象,运用民族音乐学和音乐人类学的理论方法,在对平遥盲书说唱队进行实地考察的基础上
本论文成功制备出了两种高灵敏柔性压力传感器,并首次将再生丝素蛋白/聚氨酯复合材料作为高生物相容性压力传感器的基底,提高测试舒适感的同时也对传感器起到支撑和保护作用。本次研究采用了两种不同优化方式(表面结构化和材料功能化)压力传感器的制备及其性能。主要研究内容和结论如下:1、本论文通过模拟人体皮肤表面的不规则突起微结构多壁碳纳米管/氢化苯乙烯-丁二烯-苯乙烯嵌段共聚物(MWCNTs/SEBS)复合材
积雪冰冻天气对电网、风机、高铁等结构物的安全运行产生了严重的威胁,给工农业生产带来了不稳定因素。几十年以来国内外学者对各类结构物的防冰、除冰技术进行了广泛研究,提出了输电线路直流融冰、液体防除冰、热力防除冰等多种防除冰技术。电磁脉冲除冰是一种机械式除冰技术,能耗低、可靠性高是其显著特点,具有广泛的应用前景。本文从基础理论着手,采用实验和理论结合的方法,对电磁脉冲除冰方法在结构物金属表面的应用进行了
以氨气为还原剂的选择性催化还原脱硝技术(NH3-SCR)是当前火电行业主流的氮氧化物(NOx)脱除技术。现有的SCR脱硝系统要求反应温度高于300°C来实现其较高的脱硝活性。但在温度低于280°C时,催化剂反应活性大幅降低,不能满足SCR系统高效脱硝的需求。近年来,我国工业固定源氮氧化物的减排重点由燃煤电厂逐步转向工业锅炉/窑炉等非电力行业,其排烟温度普遍低于现有SCR系统高效运行的温度范围。在N
环境作为整个社会和人类的公共物品,对经济社会的可持续发展起着至关重要的作用。当代经济社会的高速发展所带来的环境问题越来越严重,因此需要政府通过行政手段对环境进行综合整治。而水环境作为环境整体的一部分,我国政府投入大量的资金对水资源污染情况进行治理。在大环境的背景下,政府审计部门的专项审计力度不断加强,在原有的基础上探索新的审计方法、丰富原有的审计内容。对水污染防治绩效审计加强整治,对其进行专项审计
基于车联网需求多样化的背景下,针对不同服务质量需求下的车联网流量逻辑隔离是解决车辆接入中计算、无线资源高效分配的关键方案。本文基于第五代移动通信系统(5G)接入网切片、新型非正交接入技术以及边缘计算等关键技术对车联网场景下的计算资源以及无线资源高效分配的算法进行研究,并提出相应的优化方案,拟解决在高车辆密度以及有限边缘计算资源背景下的车联网超低时延需求,并提升了无线资源利用率以及能效。本文首先介绍