基于机器学习的网贷借款人违约预测研究

来源 :对外经济贸易大学 | 被引量 : 0次 | 上传用户:eyeryonecheat
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在资本市场总体低迷和理财产品打破刚兑的背景下,个人和中小企业的投融资需求较难从传统金融机构得到满足,导致了网贷行业的爆发式增长。然而网贷行业的飞速发展也伴随着风险事件的频发,监管机构为规范网贷行业,督促平台积极备案,完善平台退出机制,同时构建信用信息共享平台,打破信息孤岛。在这种情况下,提高科技水准将成为网贷平台构建核心竞争优势的重要出发点,而其中最重要的就是风控。大数据时代,互联网井喷式增长的海量行为数据,成为当下信用风险评估中新的数据来源。传统信用评估方法的短板逐渐显现,而运用机器学习技术则能更加快速、准确地识别借款人的违约行为,成为目前的研究热点。
  本文针对网贷借款人的违约行为预测问题,梳理了传统的信用风险评估方法和目前火爆的机器学习方法的相关研究文献,探讨了这两类方法的实际应用情况。在对某公司机器学习建模大赛提供的真实数据进行描述性统计分析后,就缺失值、异常值等问题进行了数据清洗,就借款人的行为信息、消费数据和历史查询记录等方面进行了特征构造与筛选;随后选取逻辑回归、神经网络和XGBoost三种方法构建违约预测模型,使用AUC值作为评价指标,实验结果表明XGBoost的分类表现优于逻辑回归和神经网络;在此基础上,采用贝叶斯算法学习得到最优的加权比例进行模型融合,发现融合模型有助于提高模型的分类准确性,且三种模型的融合效果优于两种模型。此外还对预测变量的重要性进行了排序,分析表明研究行为信息和消费数据对于违约预测是有积极意义的。
其他文献
21世纪中国进入信息时代和知识经济时代,与此同时,作为信息与知识的载体,知识型员工对于企业发展和经济发展而言开始成为强有力的推动力,在此背景下,有必要对知识型员工的激励问题进行专门研究,目前国内外学术界对于知识型员工的激励问题研究还处于起步阶段,不多的文献主要集中于一般性的理论研究,而缺乏对具体行业和企业的具体分析。而对于现代房地产企业来说,知识型员工的激励问题同样重要,由于当前房地产企业对于知识
改革开放以来,中国经济实现了突飞猛进的发展。在这个过程中,信贷、房地产与股票市场起到了重要的作用。然而,近年来三个市场都发生了剧烈的变化。信贷市场出现了密集债券违约现象,同时国家将去杠杆作为经济工作的重点;房地产市场由于棚改货币化安置政策的调整,各地房产也出现了折价销售的现象;股票市场在GDP增速下行的内部冲击与强美元和美国逆全球化的冲击下,在今年年初跌至四年来的新低。三个市场周期下行的趋势对中国
学位
消费者信心指数是反映一国(或地区)的消费者对目前的社会经济状况满意程度以及经济未来发展预期的综合指数,是监测宏观经济环境变化、预测消费趋向不可缺少的依据。消费者信心指数的值是通过对居民进行问卷调查搜集居民看法,经过一定的统计方法计算而得,但也因此存在着成本高、时效性低等问题。在当前网络高度普及的背景下,纷繁复杂的互联网数据蕴含着消费者信心的各种信息,如何从这些数据中提取出有价值的信息并以此反映消费
传统的资产定价理论基于有效市场假说,认为投资者关注是持续而且集中的,但现实中的投资者的关注力有限,不可能同时关注资本市场上的所有信息。对信息的有限关注会进一步反映在投资者的投资行为中,进而影响资产收益。本文利用新闻热度等数据研究了投资者关注对股票收益率的影响,论文随机选取了来自10个不同行业、3个不同股票交易板块的44只股票作为样本,选择雪球网社交统计数据作为投资者主动关注的代理变量,选取新闻热度
学位
波动率建模一直是金融领域的热门研究话题,而高频数据往往包含了更多的信息。Hansen et al.(2012)提出的Realized GARCH模型成功实现了收益率、波动率与已实现测度的联合建模,在Realized GARCH框架下又衍生出了许多子模型,包括本文重点关注的GARCH@CARR模型。本文利用Hansen et al.(2012)原论文中的28个个股以及1个股指数据,将GARCH@CA
学位
房地产业是国民经济的支柱产业之一,它的影响遍及经济生活的各个方面。2008年到2017年商品房和商品住宅平均销售价格年均增长率都超过了8%,不但大大增加了城镇居民的生活成本,而且还使得制造业和服务业的要素成本逐渐上升。为应对住房价格的持续升高,2010年4月17日,国务院首次下发文件提出将限购作为遏制部分城市房价过快上涨的措施。2014年,在楼市低迷的大背景下,各地限购令逐渐解除。2016年下半年
学位
本文发现月度最大日收益率(MAX)代表的偏度/类博彩特征与个人投资者偏好的股票的未来收益率之间存在显著的负相关关系,其余股票不存在这种负相关性。通过将7种与股票偏好相关的股票特征捆绑在一起,来识别个人投资者偏好的股票。本文基于个体投资者的交易行为,并构建了一个基于国内市场的综合指数来捕捉个人投资者对股票或者股票组合的偏好,并分别使用二元组合层面分析和Fama-MacBeth回归方法验证检验不同个人
学位
目前,中国仍属于发展中国家,资本是制约产业结构升级和地区经济发展的重要因素之一。金融作为资金配置的中介,在解决企业融资问题、促进区域经济发展方面发挥着核心功能。但由于中国的金融市场与西方发达国家相比尚不完善,银行业在中国金融体系中仍处于核心地位。在此背景下,研究中国银行业结构与地区经济发展之间的关系具有重大的理论和现实意义。本文以最优金融结构理论为基础,结合中国目前的要素禀赋结构和产业结构现状,选
学位
融资难问题一直是制约我国企业发展的重要因素,在企业寻求外部融资时所面临的融资约束使企业保持了较高的现金水平,从而限制了其投资机会,缓解融资约束对于促进企业外部融资具有重要的作用。  交叉持股网络作为一种日益普遍的社会网络结构,对企业的投融资行为产生着重要影响,因此,探讨企业交叉持股行为和融资约束的关系对于拓展上市公司的融资渠道具有积极的意义。  本文以我国2013年~2017年涉及交叉持股的上市公
学位
在金融行业不断发展的助推下,股票成为投资者们越来越青睐的资产选择,价值投资、技术分析等各种投资策略带给了投资者们丰厚的收益,这也在一定程度上促进了中国股票二级市场的繁荣。投资实践中,投资者们追求策略组合的超额收益,同时理论研究中学者们寻求市场超额收益的经济解释,因此对股票价格变动方向的预测研究有较大的理论和经济意义。本文以股票价格变动方向的可预测性为研究目的,中国A股市场为研究对象,构建潜在预测能
学位