论文部分内容阅读
信用风险是金融领域面临的主要风险之一,也是导致金融危机的直接原因。信用评价是揭示信用风险的有效手段,也是应对金融危机的重要措施。信用评价的本质是一个模式识别问题。评价过程中的数据具有高维性、量纲差异性等特点并且存在严重的信息冗余。因此,样本数据的降维处理和分类器的设计是信用评价的重点问题。基于邻域粗糙集的特征选择方法不需要样本的任何先验信息,有严格的数学推导,可被应用到信用评价数据的降维处理中。马氏距离不受量纲的影响,距离判别中采用马氏距离可以有效消除量纲差异对分类器的影响,提高分类准确率。基于上述分析,论文提出了一种集成变精度邻域粗糙集和马氏距离判别的信用评价方法并从UCI数据库中选取信用数据对方法的有效性进行了验证。 本论文完成的主要工作及研究成果如下: ①深入研讨了信用评价的基本理论和基本方法,较全面地综述了国内外信用评价方法的现有研究,为信用评价方法更深层次的研究奠定了基础。 ②系统地总结了信用评价中的判别分析理论和方法,学习了处理高维模式识别问题的国际前沿技术,为信用评价方法的研究奠定了理论基础。 ③针对信用评价中计算量较大,分析难度较高的问题,对特征选择思想、传统邻域粗糙集特征选择方法进行了学习和分析,建立了一种变精度的邻域粗糙集特征选择算法。 ④针对信用评价中样本数据的高维性和量纲的差异性问题,将变精度邻域粗糙集特征选择算法和马氏距离判别集成,提出了一种信用评价的新方法。无需提供样本的任何先验信息便可以在保存样本大部分信息的前提下实现数据的降维,有效减少了评价过程的计算量,提高了评价的准确率。 从UCI数据库中选择一组德国信贷样本的数据,利用新的评价方法进行分类。结果显示:新的评价方法在保持原始样本至少80%的信息的情况下,使得各类及总体的分类准确率与其它方法相比都有了较大的提高,基本都达到了70%,并且在“违约”样本的判别中表现出了较大的优势。