逻辑回归算法及其GPU并行实现研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:luo000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
逻辑回归是重要的机器学习分类方法之一,由于其模型简单、训练速度快而在互联网、金融、医疗等领域有着广泛的应用。在逻辑回归的训练过程中最主要的步骤就是使用迭代法对参数进行更新,随着实际应用中数据规模的逐渐增大,对逻辑回归的训练精度和速度有着越来越高的要求。近年来GPU硬件的不断发展,使得基于GPU的通用计算逐渐成为研究热点,这为逻辑回归的加速训练提供了有力支持。本文基于梯度下降法实现了逻辑回归及正则化逻辑回归,针对梯度下降中遇到的问题对算法进行了改进,并结合GPU的硬件特性,实现了基于GPU的并行化逻辑回归系统。论文主要完成的工作如下:针对最速梯度下降法和随机梯度下降法在训练过程中普遍存在的后期收敛慢的问题,本文提出了一种基于目标函数收敛速率的动态步长方法。该方法首先计算两次训练过程中目标函数的收敛速率,然后按照给定的更新频率和强度对训练中使用的步长进行更新,取得了后期收敛加速的效果,从而可以节省训练时间。针对1L正则化逻辑回归中使用的普通符号函数并不能真正引导出稀疏性的问题,本文提出了一种改进型的符号函数对训练中使用的下降方向进行改进。由于1L正则化项不能求导,因此在基于梯度的方法中通常引入符号函数进行计算,普通符号函数只关注参数本身的符号,而本文提出的改进方法中,通过计算参数在更新前后符号的变化来确定正则化项最后的符号,使得1L正则化逻辑回归产生了良好的稀疏性,起到了特征选择的作用。本文结合GPU的硬件特性实现了基于GPU的并行逻辑回归算法。相比于随机梯度下降法,最速梯度下降法每次使用所有样本进行更新,因此表现出较好的加速可能,在实验中将最速梯度下降法应用到大规模及高维度的数据集上都取得了良好的加速效果。
其他文献
本文试图通过江苏省无锡市歌舞团(原名)一路走来的发展历程,客观、理性、科学地了解和认识艺术表演团体改革的必然与必要性。管中窥豹无足概全,仅以一家之视角、严谨的态度,传递一
目的探究针灸配合关节腔注射药物治疗肩周炎的临床效果。方法选取2016年1月~2017年1月一年时间段内在我院诊治的肩周炎患者60例作为本次研究的病例样本分析对象,将为分为两组
治理“红包礼金”问题,是加强党风廉政建设和反腐败斗争的一项重要工作,必须用法治思维和法治方式治理,坚持标本兼治、综合治理的方针,建立健全教育、制度、监督并重的惩防体
前言一中华书局成立于1912年(民国元年),至今已有105年历史。百余年来,中华书局经历了从几个人初创,到成为国内第二大出版社;从编印教科书起家,到出版范围古今中外无所不涉,
文章阐述了中度卤水进行一次吹出提溴后,吹出废液再经过酸化、氧化、空气吹出,进行二次提溴的生产工艺,分析在二次提溴生产工艺中存在的的主要影响因素,同时为解决二次提溴存
目的:总结肝细胞腺瘤(hepatocellular adenoma,HCA)的诊治经验,探讨HCA的临床特点及治疗方法。并通过Meta分析比较实时CEUS、CT及MRI对HCA的诊断价值。方法:回顾分析33例肝细胞腺
<正>我国经济已由高速增长阶段转向高质量发展阶段,推动经济高质量发展不仅是供给侧的重要任务,也是需求侧的使命。推动经济高质量发展,既要大力补短板,促进实体经济健康发展
目的叉形头转录因子O亚型(forkhead box O,FOXO)是一类重要的信号转导分子,它的活性受到多种机制的调节,在DNA修复、复制、重组及细胞周期、细胞凋亡等过程中起重要作用。近年
个体防护装备产业在我国俗称劳保行业,已经有了50多年的发展历史。随着我国改革开放的深入和经济建设的迅猛发展,这个行业日渐兴旺起来.最近几年出现了很多令人振奋、前所未有的
2012年,"互联网+"的出现,改变了企业生存的外部环境,为创业型企业带来了更多的机遇和挑战。文章采用叙事研究方法,探究"互联网+"作为企业新外部环境,与案例对象猿题库公司企