-
公开(公告)号:CN112419045A
公开(公告)日:2021-02-26
申请号:CN202011344142.1
申请日:2020-11-25
Applicant: 苏州大学
Abstract: 本发明公开了一种基于过采样与随机森林的不平衡信贷用户分类方法,包括:步骤一:在数据清洗阶段,首先进行了探索性数据分析,对数据集中的缺值进行处理,并对数据集进行特征工程;步骤二:在数据变换阶段,采用过采样的SMOTE方法进行了处理,使训练集中违约用户和还清用户的数目接近一致,对离散型变量进行独热编码或标签编码。本发明的有益效果:本发明相比P2P信贷平台传统的信用评定方法,本发明能快速准确地提取用户贷前特征,对用户进行分类,不需要耗费大量时间进行人工审核。