生物学数据挖掘算法的设计与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:winbourbit
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究了数据挖掘中频繁模式,聚类,分类算法,并提出了能够适应生物信息学数据和大数据量的频繁模式,聚类,分类挖掘算法。同时,提出了一种保存挖掘结果的缓存机制,提高了挖掘系统的响应速度。研究工作的创新之处主要表现在如下四个方面:(1)针对已有频繁模式算法无法对具有行少列多的二维表,提出了一种采用行枚举及剪枝策略的新的挖掘频繁闭合模式的算法。(2)提出一种基于网格和密度的新聚类算法。(3)提出一种新的癌症基因分类算法,采用高效类别树构造策略,降低了树高,加速了分类过程。同时,在树节点上选出的基因子集具有更好的针对性,结合类别树的层次关系,提供了更强的生物学意义。(4)本文提出一种语义缓存机制,从而减少挖掘过程的时间开销,提高挖掘系统的响应速度。
其他文献
本文主要针对中国手语4942个手势词以及由这些手势词组成的543个连续手势句子进行了识别算法的研究,在此基础上实现了特定人的手势词和连续语句的在线实时识别.研究重点是解
集群式供应链作为一种新型的供应链组织模式,比传统的供应链具有明显的优势,如进行大规模定制化生产,降低成本,提高集群企业利润、市场竞争力和创新能力以及客户满意度等等。它是
随着计算机辅助设计技术的发展,通过实物模型产生数字模型的逆向工程技术获得了越来越广泛的应用。为了得到被测物体的完整数据模型,需要确定一个合适的坐标变换,将从各个视角得
本文的重点主要集中在特征点的匹配和多视角关系的校正.主要完成以下两方面的工作:(1)特征点匹配算法的设计.将特征匹配和极线几何估计有机的结合起来,给出一种基于组合优化
神经网络的输出对参数扰动的敏感性是神经网络设计和实现中的一个重要问题。参数的扰动对网络的输出会有怎样的影响?如何度量神经网络对参数扰动的敏感程度?本文着重计算和分
本课题针对我国海运行业业务面广,业务流程变化快,数据量大,业务系统开发工作量大、周期长以及业务数据的共享、抽取、分析,完整性、安全性的保持及高效的事务处理等问题提出
本文对网络测量、网络带宽测量的历史进行了回顾。按照测量方法的组成部分对带宽测量方法进行分类,突出了测量方法的特点,指出了各种测量方法的适用条件、技术原理和局
全球信息化快速推动了中国软件产业的不断发展,极大地促进了软件测试业的进步,但在软件测试的认识、软件测试技术、软件测试商业化等方面,目前中国的软件测试业与欧美还存在很大
本文主要研究滑动窗口连续查询的处理问题。滑动窗口查询是数据流中一类重要的查询类型。根据执行方式的不同,滑动窗口查询可以分为元组驱动滑动窗口连续查询和时间片
本文针对现在的异常检测系统由于计算机软硬件的原因,而无法很好的处理大流量的环境中的海量数据的问题,提出了一种基于数据流的在线保存数据概要信息的方法,实现了一个