论文部分内容阅读
由病毒感染诱发的多种疾病,占据流行性传染病相当大的比重,给人类健康带来严重危害。从天花、麻疹、乙型脑炎到如今的艾滋病(AIDS)、乙型肝炎病毒性肝炎、急性呼吸道综合症(SARS)和禽流感,抗病毒研究已经引起了世界性关注。人类免疫缺陷病毒(HIV)是引起艾滋病流行的相关病毒,HIV蛋白酶是艾滋病治疗的重要靶点之一。目前,经FDA批准的HIV-1蛋白酶药物有十种,但是由于病毒突变频繁,随着时间推移,病毒对其都产生抗药性,所以需要尽快研制出更多的HIV-1蛋白酶新抑制剂。
计算机辅助药物设计(CADD)是药物设计中的重要方法。它以分子力学、量子化学、结构化学理论为基础,通过模拟小分子化合物与生物大分子的相互作用来设计先导化合物。高通量虚拟筛选(HTVS)技术的出现,大大加快了药物设计和开发的速度,节约了成本。到目前为止,大量HIV蛋白酶晶体结构得到解析,同时存在丰富的HIV-1蛋白酶抑制剂活性数据。
本研究综合了基于受体和基于配体的虚拟筛选技术的不同方法,包括支持向量机(SVM)、基于形状的相似性搜索、药效团模型筛选和分子对接,建立了一套完备的针对HIV-1蛋白酶的抑制剂虚拟筛选流程。训练集和测试集以BingdingDB数据库为活性数据来源,IC50<1微摩尔或Ki<50纳摩尔的分子为HIV蛋白酶抑制剂(620个);BindingDB和NCI数据库和620个抑制剂相比,相似度低于0.4的分子作为非HIV蛋白酶抑制剂(20113个),同时还应用了DUD库中HIV蛋白酶的抑制剂(62个)和非抑制剂(2038个)。实验最终确定了针对HIV蛋白酶体系的SVM模型(54个分子描述符)、形状相似性模型(darunavir和nelfinavir)和药效团模型(7个药效团点AAADHRR)。研究结果表明,药物虚拟筛选流程为:支持向量机-形状相似性搜索-药效团模型筛选-分子对接时,Hit rate(%)明显提高,为76.4,yield(%)为60,四种筛选方法耗费的时间依次递增,符合高选出率、低耗时、低成本的虚拟筛选要求。对NCI三十万数据库按上述筛选过程,最终得到119个化合物分子,并从其中选定几十个分子将进行生物活性测试。同时,以darunavir和9Y9为模板,对其进行结构改造,改造原理是在保持小分子和蛋白原有相互作用的情况下,对两端基团进行骨架替换,最终确定两组系列化合物,用于后续实验研究和进一步构效关系研究。
本文针对HIV-1蛋白酶的虚拟筛选技术同样适用于其他具备已知活性数据的体系,特别是蛋白酶体系。支持向量机结合遗传算法进行药物筛选是以统计学习为基础的模式识别的成功应用,同时结合其他各类虚拟筛选方法,已然成为药物设计的重要方法。