跨系统表单文本处理方法、装置及可读存储介质

    公开(公告)号:CN117391081A

    公开(公告)日:2024-01-12

    申请号:CN202311409794.2

    申请日:2023-10-27

    Abstract: 本申请涉及一种跨系统表单文本处理方法、装置及可读存储介质,所述方法包括:获取历史基准表单,以及所述历史基准表单中的基准字段;获取历史从属表单,以及所述历史从属表单中与所述基准字段对应的从属字段;对所述历史基准表单中所述基准字段对应的文本数据和所述历史从属表单中所述从属字段对应的文本数据进行比较,生成文本映射表,所述文本映射表包括至少一个文本对,所述文本对包括互相映射的标准文本和非标准文本;基于所述文本映射表,将所述历史从属表单和新增从属表单中所述从属字段对应的非标准文本替换为对应的标准文本,解决了跨系统表单的数据一致性较差的问题,提高了表单数据的应用价值。

    审计疑点追踪排查方法、系统、计算机设备和存储介质

    公开(公告)号:CN117172720A

    公开(公告)日:2023-12-05

    申请号:CN202311388196.1

    申请日:2023-10-24

    Abstract: 本申请涉及一种审计疑点追踪排查方法、系统、计算机设备和存储介质。所述方法包括:获取审计疑点的排查方向并选择排查策略;若选择定制化排查策略,则基于大模型提示词样例,确定审计疑点的排查方向对应的定制化排查步骤,基于审计工具链表依次执行定制化排查步骤直至排查次数达到设定阈值,输出排查结果;若选择自动化排查策略,则利用大模型对审计疑点的排查方向进行拆解得到对应的自动化排查步骤;基于审计工具链表依次执行自动化排查步骤直至依次执行时返回的中间结果与预设结果相匹配或排查次数达到设定阈值,输出排查结果。采用本方法能够实现对用户无感且步骤可控的审计疑点排查,提高审计疑点的排查效率和排查透明性。

    一种基于时空静态信息自动化生成的预测方法及装置

    公开(公告)号:CN117494052A

    公开(公告)日:2024-02-02

    申请号:CN202311546933.6

    申请日:2023-11-17

    Abstract: 本说明书公开了一种基于时空静态信息自动化生成的预测方法及装置,可以分别通过第一嵌入网络和第二嵌入网络,得到业务对象的时序静态特征和时序静态关系图谱生成特征,并将业务对象的初始时序动态特征输入到时序动态网络中得到时序动态特征,根据时序动态特征与时序静态特征得到时序特征。而后,根据各业务对象的时序静态关系图谱生成特征生成时序静态关系图谱,将各业务对象的时序特征和时序静态关系图谱输入空间聚合网络,得到各业务对象的时空特征,从而可以通过目标业务对象的时空特征确定目标业务对象在预设时间段后的预测结果,通过预测结果对预测模型进行训练,以通过训练后的预测模型对目标业务对象的业务结果进行预测。

    一种基于贪心算法的机器学习分类模型解释方法

    公开(公告)号:CN116050539A

    公开(公告)日:2023-05-02

    申请号:CN202211687370.8

    申请日:2022-12-27

    Abstract: 一种基于贪心算法的机器学习分类模型解释方法,该方法使用贪心算法组合特征箱体,分别以每个筛选后箱体为起点,获得特征箱体组合。将特征匹配学习的特征箱体组合,可以对目标的特征统计情况有更加全面的了解并以此对机器学习结果做出解释。本方法运用贪心策略,对特征进行了筛选与组合,为企业提供了一种更加直观的客户筛选方法,在实际应用中主要用于辅助解释黑匣模型预测结果,服务一线业务人员。

    基于贷款五级分类的滚动率分析方法、系统、电子设备、介质

    公开(公告)号:CN116012137A

    公开(公告)日:2023-04-25

    申请号:CN202211623333.0

    申请日:2022-12-16

    Abstract: 本发明公开了一种基于贷款五级分类的滚动率分析方法、系统、电子设备、介质,方法包括:自定义设置初始时间节点和结束时间节点,以确定贷款滚动率分析的时间窗口;获得贷款五级分类相关的原始状态变更数据;将获取的原始状态变更数据中的贷款初始评定五级分类状态的时间点限定在时间窗口内,得到目标状态变更数据;统计目标状态变更数据中状态变更的数量,得到贷款五级分类状态的滚动率;根据贷款五级分类状态的滚动率,分析贷款五级分类状态的比例分布,融合专家经验,确定正常贷款与违约贷款的切分阈值。本发明方法仅依赖少量的原始数据,泛化性强,实用性强;本发明方法同时支持融合专家逻辑,使得过程可追溯,结果可解释,易于推广。

    一种基于自学习的场景文本匹配方法及系统

    公开(公告)号:CN115759068A

    公开(公告)日:2023-03-07

    申请号:CN202211524896.4

    申请日:2022-11-30

    Abstract: 本发明公开了一种基于自学习的场景文本匹配方法及系统,选择预训练词向量数据集,将场景语料数据转化为预训练词向量数据集对应的场景词向量;自定义设置场景语料样本数量阈值,当场景语料数据小于场景语料样本数量阈值时,场景语料数据作为少量样本,将其输入到无监督学习模型中转化为对应的第一场景文本向量;在场景语料数据积累超过设置的场景语料样本数量阈值后,将其输入有监督学习模型转化为对应的第二场景文本向量;计算第一场景文本向量、第二场景文本向量与待匹配文本的文本相似度并排序,修正文本匹配结果,得到文本匹配对;依据文本匹配对优化无监督学习模型和有监督学习模型,修正文本相似度的计算方式。

    基于贪心搜索的最大归集子图的检测方法和装置

    公开(公告)号:CN117235316A

    公开(公告)日:2023-12-15

    申请号:CN202311187793.8

    申请日:2023-09-14

    Abstract: 本申请涉及一种基于贪心搜索的最大归集子图的检测方法和装置。该方法包括:获取待检测有向图,将待检测有向图拆分出至少一个弱连通图;计算弱连通图中每个节点的节点入出差;基于节点入出差,在每一个弱连通图中检测具有大归集度的子图,得到各个弱连通图对应的初始最大归集子图;其中,归集度基于子图中的节点入出差的平均值而得到;基于初始最大归集子图,得到待检测有向图的目标最大归集子图。采用本方法能够在大规模有向图上拆分出多个弱连通图,分别从每个弱连通图中搜索归集性结构的子图,实现了在大规模有向图上对归集性结构的子图的准确高效的挖掘,解决了现有的子图搜索方法复杂度较高,计算量较大的问题。

    金融信贷场景下的数据链式存储方法、装置和系统

    公开(公告)号:CN117056426A

    公开(公告)日:2023-11-14

    申请号:CN202311015065.9

    申请日:2023-08-11

    Abstract: 本申请涉及一种金融信贷场景下的数据链式存储方法、装置和系统。所述方法包括:基于数据属性,对获取到的信贷交易流水数据进行拆分,生成对应的数据属性链下的新增节点数据,所述数据属性包括属性名称、属性类型、属性链首节点和属性链尾节点;对各所述数据属性链下的新增节点数据进行噪声检查;在所述噪声检查通过的情况下,基于所述新增节点数据,判断所述数据属性链下的所述属性链尾节点是否需要进行更新,若是,则在所述数据属性链下新建最新节点,并将所述新增节点数据存储至所述最新节点中。采用本方法能够解决传统信贷交易时交易数量量大、数据变化稀疏导致的存储资源浪费的问题,有效减少了存储资源的占用,提高了存储数据的实用性。

    基于自动特征挖掘的可解释信贷违约率预测方法、系统

    公开(公告)号:CN115936159A

    公开(公告)日:2023-04-07

    申请号:CN202211016771.0

    申请日:2022-08-24

    Abstract: 本发明公开了一种基于自动特征挖掘的可解释信贷违约率预测方法、系统,首先从客户信用资料库中提取每笔贷款的特征数据,并进行预处理;定义自动特征挖掘的操作算子集O和一种自动特征挖掘方法,并通过该操作算子集O得到自动特征集;构建违约率预测模型,并结合全局可解释方法和局部可解释方法,得到通过全局重要性特征排序、基于当前数据库搜索的反事实样本、基于特征扰动和生成模型的虚拟反事实样本,基于此给出可解释信贷违约率预测。本发明方法使得违约预测模型训练和更新无需专家经验干预,缓解专家经验差异大的问题,节省人力,能够满足审计需求,同时针对一线客户经理给出判断依据和相似判例参考。

Patent Agency Ranking