网络生物资源的优化并行整合技术研究与应用

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:youlan26
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
进入21世纪后,生物信息学作为一门新兴的交叉学科越来越引起研究者的重视。生物信息学主要是通过计算机理论与应用知识对大量的生物信息数据进行分析和挖掘,进而发现、解析和推测生命现象。随着人类基因组计划的开展以及千元美金解析人类基因组计划的提出,应不同研究方向需求,产生了大量多样的基因组数据信息。不同的数据对不同的生命现象进行描述,但是大部分研究需要在数据之间找到相关的联系,所以建立数据之间的关联信息,对数据进行整合性的分析,得到更加有意义的数据结果成为现阶段很多生物科学研究者的共同愿望。 随着计算机技术的发展,对于大量生物信息数据分析和处理已经涌现出了一系列有效可行的方法。如实现了对远程系统或数据资源的访问和收集的网络服务技术:对分布式数据库进行探索、访问及数据采集等多层次处理的多Agent技术;针对分布式数据库查询的传统优化查询技术和现代的倒排索引技术;适用于大量数据查询的Map reducemerge并行处理模式;以及适用于大量数据传输的统一文件传输格式等方向研究的技术。这些方法不但推动了生物信息研究的发展,更推动了互联网中丰富生物信息资源整合的实现,随之开发出了各种可进行数据共享、数据对比分析、并可以挖掘数据关联的生物信息整合系统。 本文在对互联网上的分布式生物信息资源整合技术进行研究分析的基础上,提出了一系列的优化解决策略。其中研究内容主要包括生物数据库整合过程中查询优化,统一数据格式,Map reduce merge并行处理技术在生物数据处理上的应用,以及多Agent的处理模块的应用等。本文按照理论与实践的联系可以分为以下几个部分:首先,介绍该研究方向的研究背景;其次介绍研究的相关理论基础;再次介绍应用于该研究的系统整体结构、处理流程以及各功能模块。然后重点突出介绍针对数据处理的并行处理模型;最后介绍系统实现及实现技术难点。
其他文献
数据流是按时间顺序到达的一个连续数据组成的一个序列。近年来,挖掘数据流的应用越来越广泛。在动态数据集上挖掘频繁项是一项困难的任务,也是一个热点。流数据频繁项挖掘是
嵌入式数据库管理系统是最近几年才兴起的一项新的数据管理技术。它以目前成熟的数据库技术为基础,针对嵌入式设备的具体特点,实现了对嵌入式数据库中数据的存储、组织和管理。
在信息技术飞速发展的当今社会,信息化研究的先进程度逐渐成为了一个国家的现代化建设水平和综合实力的象征。以现如今的发展态势来看,在未来,更快的信息分发技术和更多的信息获
基于内容的图像检索技术CBIR(Content-Based Image Retrieval)是图像处理技术和传统的多媒体信息检索方法结合的结果,是近年来检索领域内的研究热点,可以分成基于颜色、纹理、
随着数据库的广泛使用,对数据库数据的分析变得越来越重要。人们对信息的需求已从简单的数据收集型转向了分析加工型。而数据仓库技术就是针对这一问题所提出的一种技术方案。
随着计算机网络的发展,计算机网络有效地实现了网络资源的共享,但也带来了很多安全性问题。因为资源共享和信息安全是一对矛盾,随着资源共享进一步加强,随之而来的信息安全问
随着宽带网络的不断发展,通过高速互联网提供多媒体信息服务已经成为现实。作为新兴产业的IPTV,是互联网与电视融合的产物,是宽带真正走向家庭的媒介。IPTV以流媒体文件为传输内
随着雷达技术迅猛发展,现代电子对抗所面临的环境也越来越复杂。在现代战场上,由于传统的常规雷达信号易被跟踪、易被干扰,已经逐渐淡出主流。一些复杂体制雷达,如捷变频雷达
随着嵌入式系统与Internet日益深入地融合发展,越来越多的嵌入式系统具有了网络功能。对于工业、测控以及家庭网络等领域存在的众多基于8/16位MCU的低性能嵌入式系统,可采用嵌入
Web服务(Web Service)是一种新的分布式计算标准,其目标是解决异构环境下应用系统的集成和互操作。它具有开放的标准协议、高度的可集成能力、松散的耦合性和良好的封装性等