SGL-SVM方法及其应用研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:yourwp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代的到来使得机器学习方法成为时代的新宠。支持向量机(SVM)作为一种高效率的分类器,被应用于各行各业。传统的支持向量机就像一个黑匣子,无法对变量进行筛选。所以学者将支持向量机与基于惩罚函数的变量选择方法结合,实现支持向量机的变量选择,目前的方法仅可以实现支持向量机的组变量选择。本文在之前研究的基础上,将双层变量选择方法Sparse Group Lasso方法与支持向量机结合,提出SGL-SVM方法,既能在组间进行组变量选择,又能在组内进行组内变量选择,在同时存在组间稀疏性和组内稀疏性的数据中有更好的表现。本文采用坐标梯度下降法和块坐标下降法求解最优化问题,并以AUC值作为模型评价标准,通过五折交叉验证选择最优参数。在三组模拟实验中,我们将SGL-SVM与GL-SVM、L1-SVM、CSVM方法在预测效果与变量选择效果两方面进行比较,发现SGL-SVM在具有分组结构的数据中表现优秀,尤其在高维数据中优势明显。在提高预测精度的同时提高变量选择效果,在不同参数和组结构的数据中有稳定表现。因财务数据具有天然的分组结构,本文将SGL-SVM方法应用于制造业上市公司财务困境预测,选取2013到2016年A股中因财务困境被特别处理的制造业上市公司作为正例,其余A股制造业上市公司作为负例,采用过抽样与欠抽样结合的双重抽样方法对数据作平衡处理,并用原始数据的30%作为预测集对方法的预测能力进行外推检验。通过100次建模,对比SGL-SVM方法的预测效果,检验其在实际问题中的稳定性,得出SGL-SVM在正例样本预测中准确率远高于其他方法的结论,综合表现也较优。变量选择结果得出成长能力、盈利能力和收益质量是反映公司的财务状况的主要方面,现金流量和资本结构也是预测公司是否陷入财务困境的重要指标,而偿债能力和营运能力等对财务困境的预测能力相对有限。
其他文献
受新课程改革的影响,翻转课堂逐渐应用在高中的语文课程教学中,并取得了良好的教学效果。基于此,本文将从课前设计、教学活动两方面深入分析翻转课堂在高中语文教学中的应用,
通过大学生就业焦虑问卷对584名高校高校毕业生进行调查研究,结果表明,不同性别、生源地、学校类型、家庭经济状况的毕业生在就业焦虑心理上存在显著的差异,其他方面不存在显
目的探讨健康体检护理质量管理中的重点难点问题。方法选取2016年1月至2017年12月在我院健康体检的300例体检者,找出健康体检护理质量管理中的重点难点问题,根据其问题给予相
通过调查深圳龙岗现有城市生活垃圾分类现状和收运模式,分析其存在的问题和成因,提出深圳市龙岗区生活垃圾分类处理的策略。
<正>一首歌好听不好听,除了歌声的音色是否悦耳、节奏是否合拍、唱词是否动人之外,最为重要的一个因素可能就是音准了。试想,倘若一位歌声优美的歌者,一开口就"不着调",那还
“他必兴旺,我必衰微。”(约3:30)这句话是《约翰福音》记载施洗约翰讲的最后一句话,其意味深长,含义深刻。它指出基督徒灵性生命成长的要求和必然规律,耶稣基督复活的生命必归在我
在社会经济快速转型、教育事业迅猛发展的形势下,安全教育及管理是各级各类学校思想政治教育的一个重要内容,是中职学生知识体系不可缺少的一个重要组成部分,安全管理工作更是中等职业学校管理工作的重中之重。加强中职学校安全教育与管理,维护学校的正常教学及生活秩序,保障学生人身和财物安全,促进学生健康心理的形成,培养中职学生良好的职业能力和职业道德,都具有十分重要的现实意义。  一、设置安全教育课程,开展安全
耐高温胶粘剂作为一种方便有效的连接手段,是飞行器设计的重要组成部分。随着航天技术的不断发展,高速度、高精度、隐形化的高超声速飞行器成为研究的热点。在高马赫(>5Ma)飞
<正>随着数字化教学的发展,乡村教师的信息化教学意识和能力不断提高,参与实践的乡村教师越来越多。但要让数字化教学在乡村学校生根,实现常态化应用,还需要同步提高学生数字
姐妹情谊是非裔文学的经典主题,比如格罗里亚&#183;内勒的著名小说《布鲁斯特街的女人们》和艾丽斯&#183;沃克的杰出作品《紫色》。然而,在赫斯顿闻名于世的小说《他们眼望上