模型迁移方法、装置及电子设备
    42.
    发明公开

    公开(公告)号:CN118246565A

    公开(公告)日:2024-06-25

    申请号:CN202410165960.7

    申请日:2021-05-11

    Inventor: 章鹏 苏煜 阮怀玉

    Abstract: 公开一种模型迁移方法、装置及电子设备,所述模型为评分卡模型,所述方法包括:基于源场景的第一训练样本、与第一训练样本数据对应的样本标签,训练得到与源场景对应的第一机器学习模型;获取目标场景的无标签的第二训练样本;其中,所述第二训练样本与所述第一训练样本的特征空间相同;基于调整所述第二训练样本的特征分布逼近所述第一训练样本的特征分布,将所述第一机器学习模型的已训练好的模型参数进行校准,得到模型参数校准后的第二机器学习模型,以完成模型迁移。

    一种基于异常识别结果确定异常原因的方法和系统

    公开(公告)号:CN117827593A

    公开(公告)日:2024-04-05

    申请号:CN202410027543.6

    申请日:2020-06-08

    Abstract: 本说明书公开了一种基于异常识别结果确定异常原因的方法和系统。该方法包括:获取至少一个与所述异常识别结果相关联的指标,每个所述指标包括多个字段,每个字段与某一预设的业务含义相关联;基于所述每个字段确定所述每个字段对所述异常识别结果的影响因素;所述影响因素包括所述每个字段的异常度和贡献度;基于所述影响因素在所述多个字段中确定至少一个对异常识别结果有影响的字段为异常字段,基于所述异常字段确定异常原因。

    利用遗传编程的命名实体识别和提取

    公开(公告)号:CN111758098B

    公开(公告)日:2024-03-26

    申请号:CN202080001341.4

    申请日:2020-04-24

    Abstract: 本文公开了使用遗传算法生成模式程序的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。遗传算法对表示将通过命名实体识别来识别或提取的数据类别的示例数据串进行操作。在初始化阶段,基于表示将通过命名实体识别来识别或提取的数据类别的示例数据串,生成初始模式程序。从初始模式程序开始,迭代地进行遗传操作以生成多代的后代模式程序。在每一轮遗传操作中,后代模式程序是通过交叉繁殖操作和变异操作生成的。

    一种账户登录验证方法及系统
    45.
    发明公开

    公开(公告)号:CN117436051A

    公开(公告)日:2024-01-23

    申请号:CN202311397147.4

    申请日:2020-04-29

    Abstract: 公开了一种账户登录验证方法及系统。对于通过二次放号途径获得手机号的用户,其使用手机号以短信登录方式请求登录该手机号的原用户注册的账户时,风控设备会针对本次账户登录事件进行风控,并会发现存在账户丢失风险,接着,风控设备会认定服务端应当在消除账户丢失风险的前提下,才能允许本次登录。而由于短信登录方式本身就可以实现风险消除操作的效果,因此风控设备实际上只会指令服务端设备确保短信登录操作合法,并不会指令服务端设备另行执行风险消除操作。此外,风控设备为了应对二次放号风险,还会指令服务端设备基于实名认证信息对用户进行验证。

    一种企业风险识别方法、装置及设备

    公开(公告)号:CN113435762B

    公开(公告)日:2023-08-08

    申请号:CN202110757269.4

    申请日:2020-05-06

    Abstract: 本说明书实施例公开了一种企业风险识别方法、装置及设备,方案包括:获取标准化后的招聘数据,采用招聘主体企业识别模型识招聘数据对应的招聘主体企业,根据所述招聘数据生成招聘主体企业的第一企业招聘信息画像;然后根据获取的招聘主体企业的注册数据确定招聘主体企业的类比企业的第二企业招聘信息画像;计算第一企业招聘信息画像与第二企业招聘信息画像之间的差异值;当差异值大于第一预设阈值时,确定招聘主体企业存在风险。

    模型迁移方法、装置及电子设备

    公开(公告)号:CN115329958A

    公开(公告)日:2022-11-11

    申请号:CN202110510937.3

    申请日:2021-05-11

    Inventor: 阮怀玉 章鹏 苏煜

    Abstract: 一种模型迁移方法及装置,所述方法包括:基于源场景中的第一训练样本数据、与第一训练样本数据对应的样本标签对所述模型进行模型训练,得到训练完成的所述决策树模型;基于目标场景中的无样本标签对应的第二训练样本数据,对训练完成的所述决策树模型中的每个决策树分别进行剪枝处理,以完成将所述决策树模型从源场景迁移至目标场景。一方面,解决了目标场景无标签情况下模型初始化的问题,并提升迁移模型在目标场景的泛化效能;另一方面,仅需将源场景训练的决策树模型的模型参数输出到目标场景,无需要使用源场景下的数据,满足了数据安全和隐私保护的用户需求。

    一种数据采集方法、装置及设备

    公开(公告)号:CN111523826B

    公开(公告)日:2022-06-24

    申请号:CN202010393125.0

    申请日:2020-05-11

    Inventor: 崔阳 章鹏 朱标

    Abstract: 本说明书实施例公开了一种数据采集方法、装置及设备,该方案包括:通过根据目标企业的间隔采集时长,确定目标企业的第一采集价值数据;该第一采集价值数据为在当前时刻之后的预设时刻对目标企业进行数据采集而产生的价值的预测值;并根据目标企业的静态信息,确定目标企业的第二采集价值数据;该第二采集价值数据为根据目标企业的相关数据对目标企业进行风险分析而产生的价值的预测值。当基于该第一采集价值数据及第二采集价值数据计算得到的综合采集价值大于预设阈值时,再去采集目标企业的相关数据。

    训练命名实体识别模型的方法和装置

    公开(公告)号:CN114091457A

    公开(公告)日:2022-02-25

    申请号:CN202111329188.0

    申请日:2021-11-10

    Abstract: 本说明书实施例提供一种训练命名实体识别模型的方法和装置,方法包括:获取第一文本集合和第二文本集合,第一文本集合中的文本具有标注信息,标注信息包括隐私类别及其位置,第二文本集合中的文本不具有标注信息;利用第一文本集合中包括的文本及其标注信息对命名实体识别模型进行初步训练;利用初步训练后的命名实体识别模型评估第二文本集合中的各文本,根据评估结果和预先设置的挑选策略,从第二文本集合中挑选补充文本;获取补充文本的标注信息;将补充文本及其标注信息添加到第一文本集合,以扩充第一文本集合;利用扩充后的第一文本集合对命名实体识别模型进行继续训练,得到继续训练后的命名实体识别模型。能够降低人工标注成本。

    针对数据库的数据质量管理方法和装置

    公开(公告)号:CN114090558A

    公开(公告)日:2022-02-25

    申请号:CN202111329182.3

    申请日:2021-11-10

    Abstract: 本说明书实施例提供一种针对数据库的数据质量管理方法和装置,方法包括:获取针对数据库的目标SQL语句;解析目标SQL语句,得到若干个数据对象,以及该若干个数据对象之间的目标关联关系,单个数据对象为字段或数据表;根据若干个数据对象和目标关联关系,更新预先建立的数据关系记录,数据关系记录中包含数据库中至少部分数据对象,以及其间的已有关联关系;对若干个数据对象进行数据质量监控,判断是否存在数据质量不满足要求的问题数据对象;当判断结果为存在问题数据对象时,从更新后的数据关系记录中,查询与问题数据对象具有预设关联关系的目标数据对象;针对问题数据对象和目标数据对象,进行数据质量管理。能够提高数据管理效率。

Patent Agency Ranking