基于多视图的半监督特征选择算法研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:ntsx888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在处理计算机问题时,现实中遇到的数据一般都是高维度的,存在很多不相关的冗长特征。这为现实问题的解决带来了一定的困难。人们研究出了特征选择算法,以此提高算法选择的准确率。此方法可以高效的对数据进行降维,能够从数据的原始特征中直接选择出最优化的特征子集。因此,针对这一课题的研究已成为机器学习和数据挖掘领域的热点研究课题。在解决实际问题时也会发现数据之间具有多个视图,多视图学习也是机器学习过程中的重点研究课题。若是能在多视图数据之间发现他们隐藏的互补性关系,那么就可以在很大程度上提高学习的效果。然而随着现代社会技术的发展,数据的大规模应用加大了提取数据并进行标记的难度。那么如何在这种环境下获得数据之间多视图关系,并以此选择出最大相关和最小冗余的子集,这是本文研究的主要内容。参照当前计算及算法研究领域的最新进展,分析并研究出了一种基于多视图的半监督特征选择算法方式。此算法不但能够有效的提取多视图之间的互补信息,而且可以分析不同视图中各个特征间的冗余关系。结合少量标记的数据信息和没有标记的数据信息,同时进行特征选择和聚类学习,从而解决部分标记的多视图数据。本文的研究工作主要有以下贡献:(1)将本文构建一种改进的并行SVM,基于w-model,采取多个SVM分类器并行计算数据,此方法既确保分类器推广性能又缩短训练时间。(2)在进行多视图的特征选择时,对每个视图中各个特征间的冗余关系进行了综合考虑。
其他文献
数码扫描仪作为一种光、机、电、计算机一体化输入设备,应用于高端艺术品数字化复制保存领域,具有便携式、高精度、高质量的特点,有着广泛的市场的需求。本文首先提出了一种新型
随着大数据时代的来临,数据中心要存储或处理的数据的规模急剧攀升,因此有必要对现有数据中心进行扩容或者建造更多大规模数据中心,伴随而来的是能耗的大幅增长。在能源紧缺的今
近年来云计算的发展趋势让人瞩目,其用户数量正日益增加,被认为是继微型计算机、Internet后的第三次革命。云计算:就是以“网络”为中心,通过链接分布在不同地理位置的软、硬
面向双边资源整合的服务模式(BIRIS)是典型的基于中介方的服务模式,服务中介聚集了大量的顾客与服务提供者,顾客向中介方表达自己的服务需求,服务提供者向中介提供服务资源。中
糖尿病是常见病和多发病,目前还没有彻底治愈的办法。对血液中葡萄糖含量的监测是进行糖尿病诊断和治疗的重要参考依据。传统的血糖监测方法是通过间歇式采集指血的方式。动态
通用即插即用(UPnP)是由一系列协议组成的协议簇,它使用简单服务发现协议(SSDP)来控制设备加入和离开网络,使用超文本传输协议(HTTP)保证应用层通信,使用扩展标记语言(XML)和简
电子商务的迅速发展使得越来越多的用户喜欢在网上购买商品,用户在购买商品时通常喜欢参考别的用户对该商品的评论,来判断该商品是否适合自己。目前很多电子商务网站都有商品总
脑电信号包括头皮脑电信号、颅内宏电极脑电信号和颅内微电极脑电信号三种类型。这三种脑电信号经分解得到的源信号依次更精细,更接近于神经元。目前大多数专家将研究焦点集中
计算机集群的广泛应用给人们带来方便的同时,也带来了能耗问题,如何有效地利用能源,降低不必要的能耗已成为一个迫切需要解决的关键问题。作为目前最热门的海量数据处理框架,Hado
在无线通信技术飞速发展、无线业务需求日益增大、频谱“不足”与“浪费”并存的时代背景下,认知无线网络(Cognitive Wireless Network)被认为是解决频谱资源供求矛盾的核心架