生物学数据挖掘算法的设计与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：winbourbit

【摘要】

：

本文研究了数据挖掘中频繁模式，聚类，分类算法，并提出了能够适应生物信息学数据和大数据量的频繁模式，聚类，分类挖掘算法。同时，提出了一种保存挖掘结果的缓存机制，提高了挖掘系

【作者】

：

葛鹏程

【机构】

：

哈尔滨工业大学

【出处】

：

哈尔滨工业大学

【发表日期】

：

2005年期

【关键词】

：

数据挖掘频繁模式生物信息学数据语义缓存机制癌症基因分类算法新聚类算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文研究了数据挖掘中频繁模式，聚类，分类算法，并提出了能够适应生物信息学数据和大数据量的频繁模式，聚类，分类挖掘算法。同时，提出了一种保存挖掘结果的缓存机制，提高了挖掘系统的响应速度。研究工作的创新之处主要表现在如下四个方面：(1)针对已有频繁模式算法无法对具有行少列多的二维表，提出了一种采用行枚举及剪枝策略的新的挖掘频繁闭合模式的算法。(2)提出一种基于网格和密度的新聚类算法。(3)提出一种新的癌症基因分类算法，采用高效类别树构造策略，降低了树高，加速了分类过程。同时，在树节点上选出的基因子集具有更好的针对性，结合类别树的层次关系，提供了更强的生物学意义。(4)本文提出一种语义缓存机制，从而减少挖掘过程的时间开销，提高挖掘系统的响应速度。

其他文献

基于大词汇量的中国手语识别算法研究

本文主要针对中国手语4942个手势词以及由这些手势词组成的543个连续手势句子进行了识别算法的研究,在此基础上实现了特定人的手势词和连续语句的在线实时识别.研究重点是解

学位

手语识别隐马尔可夫模型动态时间规划识别速度识别率

基于计算实验的集群式供应链复杂性分析方法研究

集群式供应链作为一种新型的供应链组织模式，比传统的供应链具有明显的优势，如进行大规模定制化生产，降低成本，提高集群企业利润、市场竞争力和创新能力以及客户满意度等等。它是

学位

集群式供应链计算实验仿真环境企业协同利润分配

基于邻域特征的点云配准算法研究

随着计算机辅助设计技术的发展，通过实物模型产生数字模型的逆向工程技术获得了越来越广泛的应用。为了得到被测物体的完整数据模型，需要确定一个合适的坐标变换，将从各个视角得

学位

逆向工程点云数据初始配准精确配准

基于图像序列的场景合成

本文的重点主要集中在特征点的匹配和多视角关系的校正.主要完成以下两方面的工作:(1)特征点匹配算法的设计.将特征匹配和极线几何估计有机的结合起来,给出一种基于组合优化

学位

极线几何图像匹配组合优化场景合成特征提取边缘信息

Madaline敏感性研究

神经网络的输出对参数扰动的敏感性是神经网络设计和实现中的一个重要问题。参数的扰动对网络的输出会有怎样的影响?如何度量神经网络对参数扰动的敏感程度?本文着重计算和分

学位

Madaliue网络神经网络敏感性超立方概率

基于.NET的海运基础信息平台研究和实现

本课题针对我国海运行业业务面广,业务流程变化快,数据量大,业务系统开发工作量大、周期长以及业务数据的共享、抽取、分析,完整性、安全性的保持及高效的事务处理等问题提出

学位

NET框架多层架构商业逻辑数据持久层组件化安全拦截器

网络带宽测量方法研究及其在时间同步系统中的应用

本文对网络测量、网络带宽测量的历史进行了回顾。按照测量方法的组成部分对带宽测量方法进行分类，突出了测量方法的特点，指出了各种测量方法的适用条件、技术原理和局

学位

主动测量流量控制网络带宽测量时间同步系统搜索策略选择策略

基于Clang编译器前端的程序结构分析器的设计

全球信息化快速推动了中国软件产业的不断发展，极大地促进了软件测试业的进步，但在软件测试的认识、软件测试技术、软件测试商业化等方面，目前中国的软件测试业与欧美还存在很大

学位

软件测试抽象语法树程序结构分析代码分块

数据流滑动窗口查询处理技术的研究与实现

本文主要研究滑动窗口连续查询的处理问题。滑动窗口查询是数据流中一类重要的查询类型。根据执行方式的不同，滑动窗口查询可以分为元组驱动滑动窗口连续查询和时间片

学位

数据流滑动窗口查询连续查询聚集查询处理算法连接算法查询处理原型系统

面向大规模网络异常检测的数据流系统

本文针对现在的异常检测系统由于计算机软硬件的原因，而无法很好的处理大流量的环境中的海量数据的问题，提出了一种基于数据流的在线保存数据概要信息的方法，实现了一个

学位

数据流高频项中间层语言预查询策略异常检测概要数据结构

生物学数据挖掘算法的设计与实现

其他学术论文