【摘 要】
:
特征选择作为高维数据降维的有效方法,已被广泛应用在文本分类、信息检索、遗传基因分析等领域。现有的大多数特征选择算法都是基于有标记样本或无标记样本的。然而,除了类标
论文部分内容阅读
特征选择作为高维数据降维的有效方法,已被广泛应用在文本分类、信息检索、遗传基因分析等领域。现有的大多数特征选择算法都是基于有标记样本或无标记样本的。然而,除了类标记,还存在另一种监督信息,即标识样本对是否属于同一类的成对约束。成对约束作为一种新颖的监督信息,由于其比类标记更易获取,已在机器学习的很多方面得到了成功应用。因此,本文首先针对基于成对约束的特征选择算法从多个角度展开了充分研究。另一方面,由于稀疏表示的良好特性,近年来,也引起了机器学习领域研究人员的广泛关注。本文将稀疏表示引入特征选择方法的框架中,提出了一种全新的基于稀疏表示的特征选择算法。主要创新和研究工作总结如下:(1)在基于成对约束的特征选择算法Constraint Score的基础上,结合半监督降维的思想,通过加入全局或者局部的无监督信息,提出了半监督特征选择算法Semi-CS。Semi-CS能够同时利用成对约束和无标号数据进行特征选择,且在多个UCI高维数据集上获得了很好的性能。(2)针对Constraint Score的性能易受成对约束集具体组成影响的缺点,提出了特征选择集成算法BCS。BCS以集成的观点利用成对约束集,有效地提高了在多个UCI高维数据集和基因表达数据集上的分类和聚类性能。(3)将稀疏表示引入特征选择中,提出了基于稀疏表示的特征选择算法Sparsity Score。该算法选取最能够保持数据间稀疏重构关系的特征子集,在多个UCI高维数据集和基因表达数据集上的实验结果验证了所提算法的有效性。
其他文献
传统的智能终端文件共享环境具有针对性强,限制多,传输不稳定,使用不方便等限制。通信技术的发展、智能终端的普及,对移动计算的文件共享环境提出了新的挑战。面对新的计算环
Web服务是一种新型的Web应用程序开发模式,具有开放的通讯标准,和灵活性、互操作性等特点,成为异构系统集成的主要手段,其基本理念是:把软件做成服务,且遵从相应的标准,让不同
HPS(Human Provided Service)目前是面向服务的体系架构(Service-oriented Architecture,SOA)研究的一个重要领域。HPS架构允许人们将自己的能力及技术发布成网络服务。HPS不
本文重点讨论了一种大型VoIP系统RADIUS计费服务器功能的扩展与实现,并给出了采用Java语言的具体实现方案。该系统逻辑上分为RADIUS计费认证服务器和WEB管理系统。支持传真客
构建开放式、可扩展的系统设计工具集成框架是实现分布式协作开发的关键技术之一。使用Web服务技术,将系统设计工具的功能模块以服务形式加入到集成框架中,可以很好地满足分
教育是强国之本。在信息技术飞速发展的今天,实现信息化教育是我国未来教育建设的重中之重。我国在教育上与西方发达国家还有一定差距,特别是信息化教育。对智能教学系统的研
差分进化极限学习机(Differential Evolution Extreme Learning Machine,DE-ELM)是一种具有泛化性能好、分类精度高的机器学习算法,受到业界的广泛关注。然而随着数据爆炸式
网络运维系统是一种企业级关键应用,系统本身业务比较复杂且变更频繁,对性能要求很高。数据库访问层是运维系统实现的基础,目前数据库访问层一般采用嵌入式SQL、数据类(Data
在传统Internet迅速发展的同时,无线网络也以其独特的灵活性、便利性以及高效率的优势越来越频繁地走进人们的日常生活。然而无线网络中信道间存在干扰、带宽较低、随机错误
红眼现象是指在闪光灯模式下拍摄人像照片时,在照片中人眼的瞳孔处呈现出红色斑点的现象。红眼和一般人们所认知的眼睛颜色差别很大,降低了照片的质量,给摄影对象留下了遗憾,