【摘 要】
:
随着现代生物技术的不断发展特别是基因组计划的实施,人们不断的获得大量基因序列数据,互联网上的基因数据正呈指数增长,这些内涵丰富的数据为人们分析和研究基因的组成与功
论文部分内容阅读
随着现代生物技术的不断发展特别是基因组计划的实施,人们不断的获得大量基因序列数据,互联网上的基因数据正呈指数增长,这些内涵丰富的数据为人们分析和研究基因的组成与功能之间的关系提供了基础。现代信息技术的发展尤其是超级计算机的飞速发展所带来的高速计算能力正引导着算法研究者们不断研究出新的并行聚类算法,以解决高维海量基因序列数据的计算问题。大量事实说明,一个准确、高效的并行聚类算法对生物计算尤其是基因序列数据计算的影响力是不可估量的。本文首先对目前的几种典型的串行聚类算法就适用数据属性范围、时间复杂度等方面进行了分析,提出了对基因序列数据采用基于密度聚类的观点,提出了一种和基因序列数据相匹配的密度函数计算方法及一个相适应的邻域半径计算公式。通过对并行计算模型的研究,设计了一种基于密度的并行聚类算法,通过3次时间复杂度为O(n~2/P)的并行运算,能使并行聚类过程的时间复杂度变为O(n/P)。比较传统的基于密度的聚法算法而言,增加了一次计算,以增加一次计算为代价来减少计算机操作上的开销。最后在计算机群上对本文所提算法进行了验证,实验结果表明:此算法对高维海量基因序列数据有着很好的聚类效果,簇内数据收敛度高,展示了良好的时间优越性。
其他文献
随着互联网进一步加强其分布式计算特性,基于XML的Web服务也获得了极大的发展,但其取得真正成功的关键因素取决于其能否在保持松散耦合、语言中立、平台无关、开放性等自身特
可达性是Petri网最基本最重要的一种动态性质,其判定问题是Petri网理论研究的重要课题。本文借助代数方法对可达性进行分析,研究内容包括以下方面:(1)提出标识的不可达见证向量
随着互联网技术的飞速发展,网络安全越来越受到人们重视。恶意病毒检测是信息安全领域一个重要课题,其中对HTTP攻击检测是新的研究热点。基于隐含马尔科夫模型的检测系统可以检
云雾是影响卫星图像和航拍图像清晰度的主要因素。本文以卫星图像和航拍图像为研究对象,进行了卫星图像和航拍图像的去除薄云薄雾的研究。 云雾主要是通过粒子的散射、吸收
随着无线通信和数字电子技术的发展,由低成本、低功耗、多功能的无线传感器节点组成的无线传感网络得到迅速发展。无线传感网络是由很多无线传感器节点密集分布组成的,它具有
随着互联网的飞速发展和社会生活信息化的深入,人们越来越依赖于互联网带来的方便和快捷。与此同时,恶意代码也在与时俱进不断发展和壮大。在利益的驱动下出现了黑色产业链,黑色
随着网络技术和数字信号处理技术的发展与流行,多媒体信息安全显得日益重要。数字水印技术是用于数字产品的版权保护及内容完整性证明的重要手段;混沌序列具有良好的伪随机性、
随着我国英语教学改革的深入,学生的口头表达能力越来越受到重视,但进行大规模口语测试仍存在一些困难。针对这种现状,本文提出了一种采用语音合成和语音识别技术实现在线听说能
随着硬件技术的发展,印刷设备的输出不再局限于黑白二值,而是可以支持多级灰度,多级半色调技术作为多级印刷的关键技术之一,其性能优劣直接影响输出半色调图像的质量。因此,研究多
IP网络的飞速发展、新型网络应用的层出不穷,使得网络环境越来越复杂,给网络监测、管理和运维等带来了多方面的挑战。实现对发展中的IP网络的有效监测、管理与运维,需要功能