一种用于风险预测的模型训练方法和装置

    公开(公告)号:CN115393030A

    公开(公告)日:2022-11-25

    申请号:CN202210839874.0

    申请日:2022-07-18

    Abstract: 本发明的目的是提供一种用于风险预测的模型训练方法和装置。所述方法包括:通过对源域和目标域的样本进行二分类训练,得到源域和目标域的样本的相似度信息;从源域的样本中筛选出特征分布与目标域样本相似的样本;将筛选后的源域的样本作为训练样本来训练风险预测模型。本申请实施例具有以下优点:在训练风险预测模型时基于相似度来筛选源域中的样本,并基于相似度指标赋予筛选后的样本训练权重来训练风险预测模型,使得源域样本能够最大程度地贴合目标域样本的特征分布,提升了模型预测的准确性。

    识别风险用户的方法、装置、存储介质及电子装置

    公开(公告)号:CN114782161A

    公开(公告)日:2022-07-22

    申请号:CN202210336071.3

    申请日:2022-03-31

    Abstract: 本发明公开了一种识别风险用户的方法、装置、存储介质及电子装置。其中,该方法包括:获取目标数据;对目标数据进行预处理,得到预处理结果;基于预处理结果构建关联网络,其中,关联网络的顶点为与目标用户相关联的目标实体,关联网络的边为目标实体之间的关系;根据关联网络进行特征提取处理,得到第一用户特征、第二用户特征和第三用户特征;利用第一模型对第一用户特征、第二用户特征和第三用户特征进行风险识别处理,得到目标用户对应的风险识别结果,其中,风险识别结果用于制定目标风险策略。本发明解决了现有技术中识别风险用户的方法其规则制定成本高、可解释性较差的技术问题。

    一种模型训练方法和装置
    3.
    发明公开

    公开(公告)号:CN115619535A

    公开(公告)日:2023-01-17

    申请号:CN202211117731.5

    申请日:2022-09-14

    Inventor: 苏聪 许贤铭 杨青

    Abstract: 本发明的目的是提供一种模型训练方法和装置。所述方法包括:需要训练模型时,为源域的样本设定初始权重;使用期望最大算法,并通过迭代的方式不断更新源域好样本和坏样本的权重,以完成训练模型。本申请实施例具有以下优点:通过在在信贷领域的迁移学习问题中使用期望最大值算法来优化源域的权重,使得加权后的源域条件分布与目标域条件分布相似,从而充分将源域中的预测模型迁移到目标域中,不依赖于任何定性输入,也不需要借助于撞库分析,避免了传统迁移学习方案中定性输入数据和撞库分析带来的不确定性,提升了模型的准确性和训练效率。

    一种用于信贷风险预测的模型训练方法和装置

    公开(公告)号:CN115545876A

    公开(公告)日:2022-12-30

    申请号:CN202211023514.X

    申请日:2022-08-25

    Inventor: 曾开新 许贤铭

    Abstract: 本发明的目的是提供一种用于信贷风险预测的模型训练方法和装置。所述方法包括:将训练样本输入至风险预测模型;基于预定的损失函数来训练风险预测模型,其中,所述损失函数用于平衡好样本和坏样本的数量分布。本申请实施例具有以下优点:通过在训练模型时采用改进的损失函数,该改进的损失函数可自动适应样本大小并调整样本不平衡,从而避免了传统的二分类模型在极度不平衡样本上效果不佳、单调性较差的问题,在无需手动改变训练样本的分布的情况下提升了模型处理不平衡样本的分类问题的能力,增强了模型在信贷业务的区分能力。

    信贷风险管理方法、装置、终端及存储介质

    公开(公告)号:CN115034878A

    公开(公告)日:2022-09-09

    申请号:CN202210600998.3

    申请日:2022-05-30

    Abstract: 本申请公开了一种信贷风险管理方法、装置、终端及存储介质,方法包括:接收目标借款人对应的目标信贷业务数据;将目标信贷业务数据输入预设的风险竞争模型,得到目标信贷业务对应的违约时间的概率分布和提前还款时间的概率分布;基于违约时间的概率分布、提前还款时间的概率分布和预设的期望利润函数,确定目标信贷业务对应的多个期望利润值;基于多个期望利润值和预设的期望利润函数,确定目标信贷业务对应的目标利率、目标额度和目标期数,以基于目标利率、目标额度和目标期数对目标信贷业务进行风险管理。本发明通过发生违约与提前还款的生存时间分布来计算目标利率、目标额度和目标期数,提高了信贷风险管理的效果。

    样本预测方法、装置、终端及存储介质

    公开(公告)号:CN115630333A

    公开(公告)日:2023-01-20

    申请号:CN202211281844.9

    申请日:2022-10-19

    Inventor: 曾开新 许贤铭

    Abstract: 本申请公开了一种样本预测方法、装置、终端及存储介质,方法包括:获取目标样本;基于目标样本和N个初始二分类模型,得到N个目标二分类模型;基于目标样本、N个目标二分类模型和预设的融合方法,得到融合结果;基于融合结果和预设的判断条件,确定目标样本是否为好样本。本发明引入了一种新的模型融合方法,在有放回的采样中训练多个基分类器,基分类器的打分不直接融合,而是转化为相对排序值,即打分值在全量训练样本中的正排序的均值除以全量训练样本量,多个基分类器的相对排序值取平均来作为融合模型的最终结果。在信贷风控场景中,保证融合模型不会过拟合的同时,不需要调整基分类器的权重,就能获得较好的融合效果。

    一种用于对模型的评价指标进行评估的方法和装置

    公开(公告)号:CN115034874A

    公开(公告)日:2022-09-09

    申请号:CN202210585994.2

    申请日:2022-05-26

    Abstract: 本发明的目的是提供一种用于对模型的评价指标进行评估的方法和装置。所述方法包括:基于包含预定数量以上坏样本的样本集和训练好的评估模型,计算评估模型的预定评价指标的评估参数;不断增加抽取的坏样本的数量,并重复计算评估模型的预定评价指标的评估参数的步骤,从而得到多组对应于不同坏样本数量的评估参数;根据多组对应于不同坏样本数量的评估参数,测算有效的预定评价指标需要的坏样本数量。本申请实施例具有以下优点:通过在坏样本充足的情况下计算均值、标准差和极差来对KS指标和AUC指标的可靠性进行评估,并测算KS指标和AUC指标能够有效地评估模型所需要的坏样本数量,以提升KS指标和AUC指标的可靠性。

    样本评估方法、装置、存储介质及电子装置

    公开(公告)号:CN114912996A

    公开(公告)日:2022-08-16

    申请号:CN202210450547.6

    申请日:2022-04-27

    Abstract: 本发明公开了一种样本评估方法、装置、存储介质及电子装置。其中,该方法包括:获取第一信贷业务的第一样本和第二样本,其中,第一样本为有贷后表现的样本,第二样本为没有贷后表现的样本;从第一样本中选取训练样本,对训练样本进行特征筛选,得到第一特征,其中,第一特征包括训练样本中每个样本的贷款数据;获取第一模型,根据第一特征调整第一模型的损失函数,得到第二模型;通过第二模型对第二样本进行评估。本发明解决了相关技术的损失函数与信贷业务的匹配度低,导致得到的投资回报率较低,以及通过拒绝推断预测违约概率的准确性低的技术问题。

    风险预测方法、装置、存储介质、处理器及电子装置

    公开(公告)号:CN114862549A

    公开(公告)日:2022-08-05

    申请号:CN202210428666.1

    申请日:2022-04-22

    Inventor: 苏聪 许贤铭 杨青

    Abstract: 本发明公开了一种风险预测方法、装置、存储介质、处理器及电子装置。其中,该方法包括:获取目标样本数据,其中,目标样本数据包括多个用户的历史借款行为数据;利用目标参数调整目标样本数据在目标损失函数中的损失权重,得到调整结果;基于调整结果对目标样本数据进行拟合处理,得到风险预测结果,其中,风险预测结果用于确定目标样本数据中是否存在风险。本发明解决了相关技术中对于样本的风险预测准确性低的技术问题。

    模型拟合方法、装置、电子设备及存储介质

    公开(公告)号:CN114429397A

    公开(公告)日:2022-05-03

    申请号:CN202210103079.5

    申请日:2022-01-27

    Abstract: 本公开提供了一种模型拟合方法、装置、电子设备及存储介质,涉及计算机技术领域,以至少解决了现有技术中信贷违约预测的方法其可解释性差、计算效率慢、精度低的技术问题。具体实现方案为:基于目标用户的借款申请数据;计算目标用户的生存时间;获取目标用户的第一特征向量和第二特征向量;对生存时间、目标用户的目标状态、第一特征向量和第二特征向量进行拟合,得到目标模型;对目标模型进行评估,预测目标用户在不同时间点上的违约情况。

Patent Agency Ranking