论文部分内容阅读
药物设计是随着药物化学学科的诞生而相应出现的,主要应用于创新药物先导化合物结构的发现和优化。虚拟筛选是药物设计方法的延伸和推广,是创新药物研究的新方法和新技术。虚拟筛选是指利用计算机强大的计算能力,采用三维药效基团模型搜寻或分子对接的方法,在化合物数据库中寻找可能的活性化合物。整个筛选过程需要用到配体分子往往有数百万个。随着计算科学和计算方法的不断发展,以及计算机性能的不断提高,虚拟筛选的计算速度也在不断的提高。与此同时,在虚拟筛选速度稳步提高的情况下,化合物数据库的访问成了制约筛选速度的一个重要因素。所以设计一个支持大规模虚拟筛选的数据库管理工具可以有效的提高药物筛选的速度和效率。支持筛选的小分子数据库所具有的数据量往往是巨大的,其分子数从几十万到上千万不等。此外化合物数据库存储结构的复杂性也是造成数据量庞大的一个主要原因。而传统的集中式数据处理方式因其可靠性不高,系统的可扩充性较差,势必会成为整个系统的瓶颈。此时数据的分布式处理成为了一种必然。本文所做的工作就是围绕上述问题展开的。本文首先阐述了本论文的研究背景,介绍了国内外典型化学数据库及化学数据库管理工具的研究现状,分析了典型的虚拟筛选数据管理工具的特点。其次研究了化合物数据的处理技术,包括分子属性计算、格式转换、分子二维结构编辑和分子的二维三维显示技术。最后研究了分布式数据库技术和分布式数据库代理框架Amoeba,并在此基础上设计和实现了化合物数据的检索、子结构查询、数据子集的构建和下载等功能。