论文部分内容阅读
在小企业信用评分过程中经常出现非随机样本选择现象,该现象的产生是由于银行信贷筛选过程中会导致一部分被拒绝企业的违约行为不能被观测。数据缺失和样本选择性偏差可能导致模型参数估计有偏,从而对模型的预测能力产生较大影响。因此如何降低样本有偏问题是研究信用评分模型的重要内容之一。根据大量文献可以看出,一般的解决方法是拒绝推断技术但大多数效果不甚理想。本文采用Sebasbiani口Ramoni (2000)基于贝叶斯理论提出的界定折叠法(Bound and Collapse, BC法),结合银行信贷筛选过程,构建出一种全新的拒绝推断方法。该方法的原理是不论缺失数据机制如何,都可将缺失数据的参数估计通过某些极端分布限定在一定区间内。区间的上下限由完全集内的数据计算得出。而当缺失数据的机制可知时,区间内的信息将由非响应概率模型计算并最终获得某个单值估计。BC法的第二步是将该区间坍塌成一个对于缺失数据的估计值。通过该方法,包含有样本信息的数据将对缺失数据进行填补,从而获得完整数据样本为小企业信用评分模型的演化做准备。本文利用2003年美国小企业金融调研数据作为样本,对模型的预测力和效果进行检验与评价。首先,对第一个子样本做logistic回归构建信用评分模型,将该模型运用到第二个子样本,模拟银行信贷筛选,并产生经过信贷筛选后的选择样本。然后,基于有偏样本构建信用评分演化模型以验证其分类能力减弱甚至丧失的假设。最后,利用外部信息和内部信息来估计缺失值,并对选择样本中的每一个缺失值进行填补从而构成完整样本。利用这种拒绝推断技术的模型将与包含有全部数据的标准模型以及对缺失数据不做任何处理的审查模型进行比较。为了检验模型的鲁棒性,本文设置两种筛选率,不同的筛选率代表着样本数据缺失程度不同和样本选择性偏差不同,并分别采用KS检验、布莱尔评分、ROC曲线三种评估方法对模型进行检验。结果表明,贝叶斯界定折叠法在小企业信用评分演化模型中的应用能有效提高模型分类能力,是在非随机数据缺失机制下解决样本偏差问题的有效途径。