分布式非凸正则化方法研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:lxmcn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展,在经济学、生物信息学、社会科学和医学等诸多领域中对海量、高维数据的采集成为可能.由于这些数据量级过大,如何对其进行存储、整理并开展进一步的数据分析均面临着巨大的挑战.数据存储通常采用分布式方式,通过将数据集按某种规则分割,或者按数据流的方式存储于不同的机器,实现数据量过大时的存储问题.一个自然的问题是,现有的机器学习算法是否适用于分布式存储的数据.近年来,基于稀疏先验的正则化方法是对高维数据进行特征提取和变量选择的主要研究工具之一,但是这类方法往往都基于单机存储和处理.因此,如何开展针对分布式存储的数据分析是目前机器学习和统计学的主要工作之一.本文推广现有的稀疏正则化方法,使其适合于分析处理分布式存储数据.本文各章内容安排如下:第一章中简单叙述研究分布式非凸正则化方法的意义以及相关研究背景.第二章中提出分布式SCAD方法.基于ADMM算法提出分布式SCAD算法,并证明了算法的收敛性.实验表明,分布式SCAD算法变量选择的结果与非分布式算法变量选择的结果相同,并且能够有效的处理分布式存储的数据.第三章中提出分布式L1/2正则化方法,同样基于ADMM算法给出分布式L1/2正则化算法,并证明了算法的收敛性.注意到L1/2正则子在原点导数的特点,我们提出约束邻近正则性来解决收敛性中存在的相关问题.最后,通过与第二章类似的三个实验,我们验证了本章所提算法的有效性,以及对比分布式SCAD方法的优势所在.
其他文献
团购是2010开始流行的热门词语。Groupon在美国的迅速发展引发了全球模仿的热潮。中国是团购模仿者队伍最为壮大的一个国家。团购以其直接的盈利模式和较低的进入门槛在中国
形式概念分析(Formal Concept Analysis,FCA)是1982年德国数学家Wille R.提出的一种从形式背景进行数据分析和规则提取的强有力工具。如今这一理论已经成为人工智能学科的重
我国的私募股权基金和高新技术企业正处在高速发展的阶段,据不完全统计,我国的私募股权投资机构的数目已经超过了5000家,而且数量还在不断快速的增加,我国已然成为了亚洲最为活跃