论文部分内容阅读
大数据时代,高维混频数据普遍存在,这为信用评价与风险管理带来了机遇与挑战。充分利用高维混频数据信息,从高维变量提取重要特征,建立及时、准确的信用评价模型,预测上市公司违约风险,对于经营者、投资者、金融机构、政府监管部门都尤为重要。本文考虑高维混频数据信息,对标准Logit模型进行改造,建立新的高维混频数据Logit模型并将其应用于中国A股上市公司违约预测,主要开展了以下两方面的研究工作:(1)为解决上市公司违约预测中存在的混频数据问题,将混频数据抽样(MIDAS)方法引入标准Logit模型框架,建立了Logit-MIDAS模型并给出其极大似然估计方法。本文构建的Logit-MIDAS模型能够直接对原始混频数据建模,避免了由于频率转换引起的信息损失。同时,Logit-MIDAS模型能够充分挖掘高频信息,做到及时预测。将Logit-MIDAS模型应用中国上市公司违约预测,实证发现其比标准Logit模型具有更好的分类预测能力。考虑到样本数据的不平衡性,通过三种抽样方法以增强预测的准确度,实证结果表明Logit-MIDAS模型在样本内和样本外两个方面的表现都优于标准Logit模型。(2)为解决上市公司违约预测中的重要因素识别问题,本文在无约束混频数据抽样Logit模型(Logit-U-MIDAS)基础上,引入Group Lasso方法进行高维变量选择,构建了Logit-U-MIDAS-Group Lasso模型,能够同时进行组变量选择与模型估计,实现高维混频数据分类预测。将Logit-U-MIDAS-Group Lasso模型应用中国上市公司违约预测,发现其能够有效地从高频金融因子和低频公司治理变量中识别出重要影响因素,不仅有效地降低了金融监管成本,而且能够准确预测上市公司违约。通过不同的抽样方法进行非平衡数据处理,Logit-U-MIDAS-Group Lasso模型的预测能力进一步提高,无论是样本内拟合还是样本外预测,其表现均优于标准Logit模型和L1 Logit模型。本文研究结果表明高维混频数据Logit模型能够成功预测上市公司违约,不仅能够有效地识别关键影响因素,降低金融监管成本;而且还可以提高预测准确性,辅助金融监管决策。这一研究结果可以为公司提高自身经营能力、投资者降低投资风险、监管部门提高监管效率提供基本工具与决策参考,具有一定的理论意义与应用价值。