自组织映射聚类算法在基因表达数据分析中的应用研究

来源 :西南科技大学 | 被引量 : 0次 | 上传用户:wangy3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文应用自组织映射网络(SOM,Self-Organizing Map)和K—Means相结合的方法对用药后的抑郁症大鼠DNA的芯片样本进行聚类,从而得到不同治疗抑郁症的药物(利血平、开郁安神胶囊)对抑郁症治疗的效果。 本文首先分析了数据预处理阶段、特征提取阶段、分类器设计阶段以及聚类阶段常用的一些算法和原理,比较了这些算法、原理的优缺点,并在此基础上提出了:用看家基因调整数据的方法来进行数据预处理,用fislaer准则的思想和基于距离的判据来进行特征提取,用SOM与K—Means相结合的方法来做分类器和聚类。 在系统的评价阶段,本文得出的结论如下:从系统处理数据的速度(即从数据的输入到输出的耗时多少)来说,本系统最终用了8秒的时间,处理速度较快、从得出的结果是否易于理解来说,本系统提供了图形化的用户界面方便了用户的理解、本文的所提出的聚类方法的正确率为87.5%,结果的精度较高并且具有生物学的合理解释、本系统与WEKA系统的聚类算法进行比较的结论是:本系统在处理数据的速度上优于WEKA但在精度上略低于WEKA。
其他文献
信息安全风险评估,是依据国家有关信息安全技术标准,对信息系统进行科学评价并为受评机构提供具体安全措施建议的过程。没有准确及时的风险评估,机构将无法对其信息安全的状况做
通用串行总线(Universal Serial Bus,USB)是一种新兴的外设总线标准,具有即插即用、数据传输快速可靠、扩展方便、成本低、功耗低等优点,已成为当今个人计算机必备的接口之一,同
近两年来,流媒体技术在网络多媒体传输领域的应用越来越广泛。P2P技术的引入也使流媒体摆脱了完全依靠单一服务器的模式,降低了网络带宽占用率,提高了服务质量。涌现出了大量的
集成了传感器、嵌入式计算、网络和无线通信四大技术而形成的无线传感器网络是一种全新的信息获取和处理技术,它是—种新型的无基础设施的无线网络,能够协作地实时监测、感知和
无线网络近年来得到了大规模的应用,但是,无线网络链路本身具有信号衰落、外部干扰、多路访问竞争、节点移动等特点,使得链路的比特错误率较高,从而导致了无线网络下的TCP协
电力需求侧管理系统中汇集了各个厂商,各种不同型号的设备,使系统的功能日趋丰富。然而各个生产厂家在传输规约上基本没有统一的标准,不同厂家设备通信联接困难,给系统维护和升级造成很大的隐患。 本文对工业自动控制领域的规范--OPC技术(OLE for process control)和变电站需求侧分布式系统进行了深入的研究,针对的需求侧管理系统存在的问题,提出了在变电站需求侧系统中引入OPC技术的
句子级别的机器翻译质量估计任务以源语言语句及对应的机器翻译译文为输入,对译文的质量进行估计。随着近几年机器翻译的发展,机器翻译质量估计逐渐成为自然语言处理领域内的
波兰数学家Z.Pawlak于1982年提出的粗糙集理论是一种新的处理模糊和不确定性知识的数学工具。其主要思想就是在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类
变色龙hash函数,首先由Krawczyk和Rabin提出,它是一种带陷门的单向hash函数,掌握陷门信息的人可以容易地计算出一个随机输入的碰撞,而没有陷门信息的人则无法计算碰撞。 变色
随着移动通信技术的不断发展,手机短信以其普及率高、方便快捷、移动性好、灵活性高、价格便宜等优势获得了人们的青睐。在日常生活中,短消息成为了人们最常用的信息交流方式之
学位