基于深度学习的潜在抗HIV活性分子生成新方法研究

来源 :兰州大学 | 被引量 : 1次 | 上传用户:cgrong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
艾滋病是对人类危害最大的疾病之一,由感染HIV引起。现阶段在全球范围内仍然缺乏有效治愈艾滋病的方法,抗HIV药物是防治艾滋病最有效的手段之一。HIV具有耐药性,因此需要不断发现新的抗HIV活性分子,以研制更多的抗HIV药物。本文对现有的新型药物设计方法进行改进,并采用两种不同的方法生成潜在抗HIV活性分子,以扩增潜在抗HIV活性分子库。本文为发现新的抗HIV活性分子提供了新思路,主要创新及工作内容包含以下几个方面:(1)搭建深度分子生成模型DGMM,旨在生成结构有效、新颖且性质无偏的分子。DGMM基于MLSTM、SRU、QRNN三种循环单元进行构造,采用源自ChEMBL的大型分子数据集进行训练。经过训练,基于MLSTM搭建的DGMM取得最优效果,其生成分子的平均有效性为98.31%,唯一性为99.93%,新颖性为89.33%,综合优于现有的化学语言模型。随后将最优DGMM生成的分子与训练集分子进行性质对比,实验结果表明DGMM生成的分子能够还原训练集分子的性质分布,验证了DGMM生成分子的性质无偏性。(2)搭建深度迁移分子生成模型T-DGMM,旨在生成潜在抗HIV活性分子,扩增潜在抗HIV活性分子库;搭建抗HIV活性预测模型AAPM,验证TDGMM生成分子的潜在抗HIV活性。为了验证迁移学习方法的有效性,T-DGMM基于两种不同规模的抗HIV活性数据集进行训练,最终在基于极小规模数据集训练的T-DGMM生成的分子中检验到已知抗HIV活性的分子。AAPM采用不同深度学习架构进行搭建,训练集规模为正负样本各一万,最终基于DNN的AAPM外部验证集准确率达88.90%。最后基于AAPM预测T-DGMM生成分子的抗HIV活性,其中最高68.29%被判别为抗HIV活性,验证了T-DGMM的有效性。(3)搭建深度强化分子生成模型R-DGMM,分别进行两个不同的任务。任务一是生成利匹韦林的相似物,最终R-DGMM生成了包含达匹韦林在内的9种抗HIV活性分子。任务二设计了组合评分函数,旨在生成同时具有潜在抗HIV活性、期望合成可及性及类药性的分子,最终R-DGMM生成了2种已知抗HIV活性的分子。两个任务均表明R-DGMM适用于生成潜在抗HIV活性分子。
其他文献
结合“十二五”国家及造纸工业关于发展低碳绿色纸业规划要求,分析了制浆造纸过程能源消耗状况,重点讨论了当今国际上造纸业提倡推广的先进、成熟、适用的节能技术与装备,为我国
有人说,果酱是一个水果生命的延续。当季水果的保鲜期往往只有短短的几天,想让它的美味延续,那就做成果酱吧!把它的酸、甜、香、软交给一个个小瓶去保存。
霍尔推进器具有体积小、比冲高和可实现推力灵活调节的优点,搭载中小功率霍尔推进器的小卫星可执行轨道维持和精准姿态调节等任务,可实现无拖曳控制。然而,现有的霍尔推进器
为提高奥氏体不锈钢抗高温氧化及化学侵蚀能力,确立了以SiO2-BaO-Al2O3-Cr2O3为主要化学组成的氧化物陶瓷涂层体系,并对涂层的制备工艺进行了探讨。涂层制备工艺:研磨后的涂层粉
糖尿病是一种以慢性血糖水平增高为特征的代谢性疾病,其中肥胖是发生2型糖尿病的一个重要危险因素。糖尿病的发生与肥胖的持续时间和最高肥胖程度密切相关,在肥胖人群体内脂