基于机器学习的可解释信贷风险评分和违约预测研究

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:acy333
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济、技术的发展,新的消费形式潜移默化的促使了人们超前消费观的形成,贷款逐渐成为了新消费形式下的主要承载对象。互联网金融应运而生,将个人信贷业务广泛的开展到人们的生活之中,信贷的发展不仅解决了个人资金短缺的问题,还加快了社会资金的周转,促进了整体的消费。可信贷的高风险性一直是人们十分在意的问题,如何帮助贷款机构建立全面、完善、准确的风险评估模型,提前防范违约风险、甄别关键风险特征,成为了一个重要研究问题。如今人工智能领域的快速发展为信贷风险识别提供了新的思路,利用相关机器学习技术辅助金融系统的决策,是防控信用风险的重要发展方向。本文利用Lending Club的真实借贷数据,建立了贷前风险评分模型和贷后违约预测模型,并对影响信贷风险的关键特征进行了识别。本文的主要研究内容和方法包括:首先,针对贷前申请阶段,通过对变量进行卡方分箱、WOE编码和计算IV值,筛选出了影响客户信用风险的11个重要特征,再利用这些特征建立了基于Logistic的贷前风险评分模型,通过评分尺度化将回归结果转化为了评分卡的形式,使模型更具直观性和可解释性;然后,针对贷款发生后,通过加入客户还款表现的信息,构建了基于XGBoost的贷后违约预测模型,通过网格搜索调参,使模型取得了更好的效果,并基于SHAP值对模型进行可解释性分析,识别重要风险特征;最后,结合具体样本,展示两个模型在贷前风控和贷后风控管理中的应用,突出模型的真实性和实用性。研究发现:客户的信用等级、工作年限、省份、收入贷款比、按揭账户数、欠款总额等是影响客户贷款申请风险评分的重要因素,评分低于450分的为高风险客户,高于550分的为低风险客户,当以487分为界限划分客户时,评分卡模型达到最佳的效果;XGBoost模型在贷后的违约预测上,有着出色的效果,网格调参方法能有效提升模型的性能,相比其他机器学习模型,XGBoost模型表现最好,通过SHAP值识别出了贷后变量中剩余未还本金和已收利息是是否违约的重要影响因素。
其他文献
新高考改革背景下,高中英语教学中对于学生的写作能力提出了更加细致的要求,教师需要结合教学目标优化写作教学过程,使学生的英语水平、写作能力得以提高。本文基于新高考改革背景下高中英语写作教学创新的意义和现阶段高中英语写作教学面临的困境,从“构建合作探究课堂,诱发学生写作兴趣”“把握知识内在联系,丰富学生词汇储备”“发掘生活写作素材,培育学生写作能力”“深入解析语篇结构,培养优良学习习惯”四方面着手,对
为了准确预测空气质量,结合实际的天气污染情况,在WRF-CMAQ等一次预报模型的基础上,利用神经网络、机器学习方法中的LSTM算法以及线性学习方法,针对大量的数据进行二次数学建模来提升预测的准确性,同时解决了对现实中存在数据不全导致无法预测的问题.根据预测数据和实际数据对比,建立的空气质量预测模型预测出的数据与真实值的误差均在2%以内.
<正>近年来,我国突发公共卫生事件频繁发生,其破坏性、突发性、不可预知性及后果严重性受到了普遍关注。为加强突发公共卫生事件的有效防控和应急处置,突发公共卫生事件形成的各种档案资料就具有了不可替代的凭证价值和决策依据,并在应对灾难、研究成因、警示后人、记载历史等方面的作用逐渐被人们认知,其重要性日益凸显。因此,加强突发性公共卫生事件档案的建设与管理已成为档案工作者亟待研究、解决的重大课题。一、做好突
期刊
2020年11月16日至17日,中央全面依法治国工作会议正式提出"习近平法治思想",为当前全面推进依法治国、全面推进中国特色社会主义法治体系建设提供了根本遵循与行动指南。宪法是国家根本大法,依法治国首先是依宪治国。党的十八大以来,加强宪法实施、维护宪法权威,始终是党和国家的明确主张,也得到了全社会各方面的坚定支持与热烈拥护。关于宪法的思想是习近平法治思想的重要组成部分。在深入学习与阐释习近平法治思
期刊
目的 对比经尿道1470nm激光前列腺剜除术和经尿道前列腺等离子电切术(transurethral plasma kinetic prostatectomy,TUPKP)治疗良性前列腺增生的疗效及安全性。方法 选择2018年1月至2021年12月湖北省荆门市第二人民医院收治前列腺增生行手术治疗患者760例,根据治疗方法分为TUPKP组441例(采用经尿道前列腺等离子电切术治疗)和剜除组319例(采
小微信贷风险在最近几年逐渐引起了以银行业为代表的金融行业的广泛关注。在供给侧结构性改革的大背景下,国内外宏观经济环境发生了变化,经济结构转型步伐加快,部分行业出现了产能过剩的现象,监管指标中增加了对小微信贷的考核,各种因素给银行业的小微信贷风险管理带来较大的挑战。C银行天津分行是天津地区小微金融的标杆银行,因此对其小微信贷风险管理情况进行研究,能树立很好的典范作用。本文的研究对象是C银行天津分行,
目的:建立不同产地文王一支笔药材的HPLC指纹图谱,并结合化学模式识别技术对其进行质量评价。方法:采用Shim-pack GIS C18色谱柱(250 mm×4.6 mm, 5μm),乙腈-0.2%乙酸水溶液为流动相,梯度洗脱,流速1.0 mL·min-1,检测波长320 nm,对各产地文王一支笔进行HPLC分析。采用中药指纹图谱相似度评价系统建立指纹图谱共有模式和相似度计算,SPSS20.0和S
针对可穿戴设备的长时间心电记录、实时分类及对心电数据的远程监测分析问题,开发了一个对接医疗级心电采集终端,并实现实时监测、实时分析,并通过深度学习模型自动对心律失常分类的通用系统。该系统中部署的深度学习模型是基于残差网络构建的,深度学习模型的训练和测试使用2017年心脏病学挑战赛(CinC2017)提供的数据集。训练和测试结果显示,模型具有较好的性能。系统通过反向代理服务器(Nginx)部署在阿里
生物多样性演化模式及其与环境变化的相互关系是现代古生物学的研究热点之一。随着年代地层学和古生物学的发展,传统的多样性统计方法不能满足当今高精度地层对比分析的需求,而定量地层学方法具有更高的时间分辨率,在深时生物多样性研究中正得到广泛应用。本文简要介绍了目前常用的定量地层学方法(包括图形对比法、约束优化法、RASC法和单元组合法),以及应用约束优化法进行地层综合对比的过程,包括:选择数据、厘定和输入
化石燃料的过度使用给环境带来了不可逆转的影响,随着节能减排观念的提出,具有高热值的清洁能源天然气占比逐年增高。液态天然气(Liquefies Natural Gas,LNG)体积小、重量轻,常用于天然气的贸易运输。FSRU船舶(Floating Storage and Re-gasification Unit)除了可对LNG进行运输外,还能在近海岸对LNG进行卸载、气化等工作,具有较强的灵活机动性