-
公开(公告)号:CN116226741A
公开(公告)日:2023-06-06
申请号:CN202310204578.8
申请日:2023-03-03
Applicant: 度小满科技(北京)有限公司
IPC: G06F18/241 , G06F18/214
Abstract: 本发明的目的是提供一种基于数据类型进行建模的方法和装置。所述方法包括:通过对用户的征信报告进行解析,得到相应的征信数据;将所述征信数据按照预定的多个数据类型进行分类;基于分类后的对应于不同数据类型的征信数据,构建和训练神经网络模型,其中,该模型包括多个分别适用于不同数据类型的子模型。本申请实施例具有以下优点:通过将征信数据按照预定的多个数据类型进行分类,并对征信报告各个字段下的各项数据按照预定的多个数据类型进行建模,降低了征信报告变量管理的复杂度;如果需要进行后续模型的迭代升级,只需修改对应数据类型的神经网络结构即可对所有的同一类型数据生效。
-
公开(公告)号:CN117093933A
公开(公告)日:2023-11-21
申请号:CN202310851489.2
申请日:2023-07-12
Applicant: 度小满科技(北京)有限公司
IPC: G06F18/243 , G06F18/2415 , G06F18/27 , G06N5/01 , G06Q40/03
Abstract: 本发明提供一种模型构建方法、装置、存储介质及电子设备,其中,该方法包括:获取N个第一历史样本集,以及获取第二历史样本集,同一第一历史样本集中的第一历史样本对应同一利率信息,且一个第二历史样本对应的利率信息为随机生成的利率信息,N为正整数;分别采用N个第一历史样本集中的各个第一历史样本集,确定N个单一利率模型,N个单一利率模型中的各个单一利率模型与各个第一历史样本集一一对应;基于第二历史样本集和各个单一利率模型,构建利率敏感模型,利率敏感模型用于预测目标对象的利率敏感度。本发明实施例可精确地获取目标对象的利率敏感度,以基于目标对象的利率敏感度为目标对象确定合适的利率信息。
-
公开(公告)号:CN119205304A
公开(公告)日:2024-12-27
申请号:CN202411307913.8
申请日:2024-09-19
Applicant: 度小满科技(北京)有限公司
IPC: G06Q40/03 , G06N3/02 , G06F18/241
Abstract: 本申请实施例提供一种信贷逾期识别方法、装置及电子设备,该方法通过获取待识别目标用户的用户特征,将待识别用户的用户特征输入至预先训练好的预设信贷逾期识别模型中,由该预设信贷逾期识别模型基于用户特征确定待识别目标用户的各信贷周期下的逾期概率。因该预设信贷逾期识别模型训练阶段所采用各训练样本数据是不区分具体是长期逾期还是短期逾期,基于各训练样本数据的实际逾期概率排序对初始信贷逾期识别模型进行训练,直至训练得到的信贷逾期识别模型输出的预测逾期概率排序结果与该实际逾期概率排序之间的误差足够小。如此在信贷逾期识别时,无论长期逾期用户还是短期逾期用户,均能进行信贷逾期识别,降低信贷逾期风险及坏账风险。
-
公开(公告)号:CN118037436A
公开(公告)日:2024-05-14
申请号:CN202410336547.2
申请日:2024-03-22
Applicant: 度小满科技(北京)有限公司
Abstract: 本发明提供一种用户信用评估方法、装置、电子设备及可读存储介质,包括:接收处于第一阶段用户的信用评估请求;响应于所述信用评估请求,获取所述处于第一阶段用户的第一用户数据,所述第一用户数据包括申请用户数据和未申请用户数据;获取第一评估模型;将所述第一用户数据输入所述第一评估模型进行信用资质评估,获得与所述第一用户数据对应的若干个目标用户的信用资质评估结果。本发明解决了针对两个阶段的用户客群因为在时间窗口上的差异而需要分别建模的问题,综合了用户的用信需求和用信资质进行用户的信用资质评估。
-
公开(公告)号:CN116776940A
公开(公告)日:2023-09-19
申请号:CN202310716795.5
申请日:2023-06-16
Applicant: 度小满科技(北京)有限公司
IPC: G06N3/0499 , G06N3/084 , G06N3/088
Abstract: 本申请实施例提供了一种神经网络模型生成方法、装置及电子设备,其中,该神经网络模型生成方法包括:基于原始神经网络模型的各项结构参数、权重,确定不同的第一目标子网络模型,根据目标硬件设备的部署要求,再结合各个第一目标子网络模型的性能参数,自适应地生成满足目标硬件设备的部署条件的第二目标子网络模型。如此,可使用规模小且精度高的第二目标子网络模型替代原始神经网络模型部署至目标硬件设备中,该第二目标子网络模型所需的硬件资源较少,能够扩展原始神经网络模型的应用范围的同时,该第二目标子网络模型是适配目标硬件设备的所有子网络模型集合中,精度最高的一个,实现了针对目标硬件设备的最优化模型部署。
-
公开(公告)号:CN114742126A
公开(公告)日:2022-07-12
申请号:CN202210216222.1
申请日:2022-03-07
Applicant: 度小满科技(北京)有限公司
Abstract: 本发明公开了一种样本扩充方法,该方法直接从历史产品的记录数据中挑选属性相似且满足表现期时长的历史产品记录,将其作为新产品的扩充样本添加至样本集中进行建模分析,属性相似性的评判可以有效保障模型分析效果;且样本扩充的过程无需等待新产品的运行表现,具有高时效性;另外,该方法可以直接依据属性以及表现期长度自动进行指标判断,稳定性强且简单高效。本发明还公开了一种样本扩充装置、设备及可读存储介质,具有相应的技术效果。
-
公开(公告)号:CN118798429A
公开(公告)日:2024-10-18
申请号:CN202410923090.5
申请日:2024-07-10
Applicant: 度小满科技(北京)有限公司
IPC: G06Q10/04 , G06F18/213
Abstract: 本发明提供一种用户数据处理方法、装置、电子设备及可读存储介质,对于来自多个数据源的用户数据,将其按照不同的序列数据类型映射处理为对应的向量数据。按照向量数据所对应的用户信息,将不同数据源中属于同一用户的向量数据进行同类合并,得到每个用户的多个向量集合。选取每个向量集合中的最大值作为该向量集合的单向量子特征,以便于后续进行用户的用户数据分析预测时,将多个单向量子特征合并为综合特征,按照预测需求进行用户的预测。本发明提供的用户数据处理方法,能够适用于多数据源的各类型序列数据,不需要根据序列数据的类型分建子模型进行分别处理,序列数据的处理效率得到了提升。
-
公开(公告)号:CN116308757A
公开(公告)日:2023-06-23
申请号:CN202310295043.6
申请日:2023-03-23
Applicant: 度小满科技(北京)有限公司
Abstract: 本发明提供一种基于知识蒸馏的信贷风控模型训练方法、装置、电子设备及计算机介质,包括:获取信贷样本数据,所述信贷样本数据包括用信用户的第一信贷特征和风险属性;根据教师模型和申请用户的第二信贷特征,提取所述申请用户的概率风险值;基于所述概率风险值和所述第二信贷特征,采用第一交叉熵损失函数对知识蒸馏模型进行预训练,得到学生模型;根据所述第一信贷特征和风险属性,对所述学生模型进行优化训练,得到目标风控模型,充分利用了各个用户的第一信贷特征和第二信贷特征,克服了只在用信用户上训练的问题,不仅提高了数据的使用效率,可以客服现有模型中使用0/1硬标签训练风控模型存在的模型“过度自信”问题和标签噪声问题。
-
公开(公告)号:CN114463113A
公开(公告)日:2022-05-10
申请号:CN202210099499.0
申请日:2022-01-27
Applicant: 度小满科技(北京)有限公司
Abstract: 本申请提供了一种用于在征信风控建模中补充正样本的方法和装置,该方法包括:从本机构的全量征信报告中选择出本机构的未用信用户所对应的多个征信报告;针对所述多个征信报告中的每个征信报告,对该征信报告中的贷款记录进行解析并判断是否存在逾期贷款记录,若是,记录所述逾期贷款记录对应的明细信息,否则,为该征信报告添加无逾期标记;从解析后的多个征信报告中筛选出用于征信风控建模的正样本。本申请能够通过将未用信用户在其他机构的逾期表现推断为在本机构借贷的逾期表现,并作为模型训练的标签,来扩充征信风控模型训练的正样本,从而有效缓解征信风控建模中正样本不足及样本不均衡问题,增强征信风控模型的识别风险能力和泛化能力。
-
-
-
-
-
-
-
-