【摘 要】
:
网络贷款用户的信用评估问题对互联网借贷公司有着非常重要的意义,本文尝试利用用户特征预测用户未来的负债情况,以对现阶段信用评估问题做出新的贡献。线性回归方法是最经典的统计方法之一,直到今天仍有很多新的改进与探讨。本文将利用线性回归模型对用户的未来负债进行预测并探讨几种方法的优劣对比。在进行多元回归时,多重共线性会导致模型出现很多问题,为减小或消除多重共线性带来的影响,本文主要介绍了传统的有偏估计方法
论文部分内容阅读
网络贷款用户的信用评估问题对互联网借贷公司有着非常重要的意义,本文尝试利用用户特征预测用户未来的负债情况,以对现阶段信用评估问题做出新的贡献。线性回归方法是最经典的统计方法之一,直到今天仍有很多新的改进与探讨。本文将利用线性回归模型对用户的未来负债进行预测并探讨几种方法的优劣对比。在进行多元回归时,多重共线性会导致模型出现很多问题,为减小或消除多重共线性带来的影响,本文主要介绍了传统的有偏估计方法与机器学习方法,研究内容可主要分为以下几个部分:首先,简单回顾了最小二乘法与多重共线性对其造成的影响,并介绍了负债分析的含义、作用及可行性。然后,分两部分分别介绍了用于建立线性回归模型的有偏估计方法和机器学习方法:Liu估计,主成分估计和Lasso估计,支持向量回归机和XGBoost模型。分别讨论了这些方法的相关理论、实现过程以及它们改善多重共线性的原理。最后,获取数据进行实证分析,取2018年5月数据预测用户8月的负债借款情况,得到预测结果并对比几种方法在该情况下的适用性与优劣性,最后给出结论。本文针对负债分析问题,对比了几种线性回归算法的预测效果,为今后的应用提供了实例与依据。
其他文献
传统的二维地理信息系统对空间信息的展现是比较抽象的,无法满足人们利用空间信息对现实世界认识和改造的需求。三维GIS能够更加直观的展示空间信息,随着网络技术、存储技术
背景:血液透析(hemodialysis,HD)是终末期肾病(end-stage renal disease,ESRD)患者的主要治疗手段,故保障血液净化治疗的重要条件:抗凝,就显得越发重要。目前,普通肝素(unfraction
叙述了中国航海博物馆在运营阶段针对双曲面索网索力的长期监测和研究。介绍了监测采用的方法、监测的方案以及监测测量的结果。并对监测结果与设计结果进行比较分析,得出了
试验以一串红、波斯菊、金鸡菊、百日菊、蓝蓟、虞美人、大花飞燕草、福禄考、红蓼、婆婆纳、紫花苜蓿、满天星、宿根蓝亚麻、百里香、蓝花鼠尾草、小冠花、藿香、射干、常夏石竹、马蔺等20种花卉配置出11个组合,总结邯郸地区野花组合营建技术,构建野花组合综合评价体系,为野花组合的应用提供科学性的理论基础。试验观测各组合生长情况、观赏特征及对周围小气候的改善能力,得出以下结论:1、在满足种子萌发所需条件下,同一
陈亮是南宋时期著名的爱国思想家,浙东“永康学派”的代表人物。在面对南宋社会消沉的民生现状,他矢志不渝,一生以富民强国为志向,以事功之学为本源,从养民的角度提出了一系
介绍了马钢棒材生产线穿水冷却的工艺及控制系统,对棒材上冷床温度定时检测装置进行了详细的说明.从软硬件设计方面分析了该系统的改造与控制系统方案及实现.该系统投入使用