基于非对称信息数据的信用卡欺诈识别问题研究

来源 :南京师范大学 | 被引量 : 3次 | 上传用户:rylqy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着世界经济、信息技术水平不断提高,越来越多的人开始使用信用卡进行交易,信用卡已成为现代生活中非常重要的支付手段,尤其是在欧洲、美国等发达国家,信用卡业务体系相当完善。在我国,虽然信用卡发展时间较短但发展速度迅猛。信用卡透支消费已成为中国新型消费模式,并有望在不久的将来成为主要消费模式。伴随着信用卡使用规模的迅速扩大,信用卡欺诈问题变得越来越严峻,解决此问题已变得刻不容缓。信用卡欺诈问题不仅在经济上令银行蒙受巨额损失,还让银行因此失去大量客户资源,极大地影响了我国商业银行风险控制情况,严重阻碍我国金融系统的正常发展壮大。因此寻找合适的信用卡欺诈风险监测识别方法刻不容缓。随着近年来数据挖掘技术的逐步成熟,将数据挖掘和机器学习技术应用于信用卡欺诈风险检测和识别已成为了此领域新的研究趋势。本文以欧洲信用卡中心2日内交易数据为例,构建欺诈交易识别模型。从抽样和算法两个角度处理因欺诈交易量低而导致的数据信息不对称问题。从抽样角度出发,利用SMOTE抽样方法使欺诈交易数据量与正常交易数据量相同,然后通过Logistic回归方法构建欺诈识别模型。从算法角度考虑,通过引入代价矩阵,对不同类别的数据赋予不同的代价权重,从而构建整个模型。这里采用Adaboost的改进算法AdaCost对数据集进行建模。最终采用AUPRC (AreaUnderthe Precision and Recall Curve)和 AUROC (Area Under the Receiver Operating Characteristic)两个指标对模型进行评价,发现无论从算法角度还是抽样角度均能很好地识别欺诈交易并且效果基本相同。该结果也验证了对不平衡数据问题从抽样和算法两个角度建立适当的模型是等效的。
其他文献
基于分县数据,在分析人口空间分布地域格局的基础上,利用人口数量增减变化和人口稳定度对近30年来河北省人口分布格局时空变化进行了研究。结果表明:河北省人口密度分布呈"西
考虑到城市给水工程规划的重要性, 结合城市的实际状况落实好城市给水系统重新规划工作, 这样既有助于保障人们生活质量, 又能够推动城市经济发展, 提升城市现代化水平. 本文
对解析函数f(z)=p(z)/q(z),当z=a分别是p(z)和q(z)的m级零点和n级零点,且0≤m<n时,特别地n=m+2时,讨论了求f(z)在极点z=a处留数的方法并举例说明其应用.
体育游戏是一项侧重团队合作、规则性强的活动,可提高初中生的集体荣誉感和遵守规则及法律的自觉性,尤其是针对平时纪律观念、集体荣誉感较差的学生,体育游戏的教育性作用更