【摘 要】
:
任何一门学科的快速发展都离不开社会需求的支持和推动,随着人们对生活质量和健康水平的日益重视,医学已经成为本世纪发展得最快的学科之一。在医学迅猛发展的过程中积累了大
论文部分内容阅读
任何一门学科的快速发展都离不开社会需求的支持和推动,随着人们对生活质量和健康水平的日益重视,医学已经成为本世纪发展得最快的学科之一。在医学迅猛发展的过程中积累了大量的数据,毋庸置疑,其中的大部分医学数据都包含了极其宝贵的信息,于是如何有效管理和利用这些数据成为亟待解决的问题,由此催生了医学信息学和生物信息学这两门衍生学科,它们在侧重点、研究方法、研究对象等方面都存在诸多差异,但是适用于医学数据的数据分析和挖掘技术却是这两门学科共同关注的焦点。本文在深入研究基因表达式编程和数据挖掘技术的基础上提出了两个适用于医学数据挖掘的算法:基于基因表达式编程和粗糙集的属性约简算法GEPFS以及基于基因表达式编程的核K近邻分类器GEPKNN。GEPFS适用于离散型数据的属性约简,它力图在最小化属性子集和最大化分类精度两方面达到平衡,实验表明约简后的数据质量确实得到了一定程度的改善。GEPKNN则试图改进目前广泛应用于生物信息学领域的核K近邻分类器,它自动地为核K近邻分类器构造与数据相关的核函数,避免了人工指定核函数的主观随意性,从而提升了核K近邻分类器的分类性能。在文章的最后,我们把上述两个算法分别用于两个有实际应用价值的医学数据挖掘问题——自动化导诊和微阵列数据分类。实验表明它们在各自的应用领域都取得了比较好的效果
其他文献
分散在互联网上的信息资源极其丰富,但表现形式却各不相同,如何全面准确地从中查找特定信息一直是网络应用服务的重要研究内容。传统的搜索引擎使用简单的关键词匹配查找信息,尽
社团是复杂网络广泛存在的拓扑特性之一,发现网络中的社团结构是复杂网络研究的基础性问题,也是热点问题。社团划分算法按划分结果可以分为重叠和非重叠社团划分算法两类。在社
公平交换协议用来保证参与交换的各方以一种公平的方式交换信息,要么任何一方都可以得到对方的信息,要么都得不到对方的信息。公平交换协议在电子商务、电子政务等领域发挥着
随着中国物流行业的飞速发展,市场竞争日益激烈,传统的人力劳动性生产模式已不能适应不断增长的大规模邮政生产需求。从粗放式生产的转变集约性生产已迫在眉睫。而以大型设备为
网格系统为用户提供了一种全面共享各种网格资源的基础设施。随着Internet与计算机技术的飞速发展,网格系统中资源的数目日益庞大,交互更加频繁,而网格资源本身又具有分布性
认证协议是安全协议中最基本、最重要的一种,其目标是实现通信实体的身份认证和在通信实体间分发会话密钥。对认证协议的攻击形式有很多,但已构成的攻击事例中,百分之九十以
近年来,随着计算机计算速度和能力的大幅提高,传统的加密技术已经不能满足当代网络通信安全性的需求。由于混沌具有一系列较好的特性,如对初始条件和控制参数的极端敏感性,伪随机
基于背包问题的公钥密码算法是密码学历史上最早被设计出来的几个公钥密码算法之一。由于背包密码的快速加解密优势和背包问题是NP完全问题,很长一段时间内背包算法受到普遍
数字水印技术是信息隐藏技术的重要研究方向,它在数字图像等多媒体版权保护以及内容认证方面具有重要价值。互联网的便捷性和数字媒体复制的低成本,在促进数字产品在现实中的
程序是用计算机程序设计语言编写的用于实现某种操作的指令集合,程序为了对抗逆向分析或者是代码窃取,通常会采取一些自我保护技术,程序行为或者代码隐藏技术属于其中的一种。程