分类模型的训练方法和装置

    公开(公告)号:CN110728328B

    公开(公告)日:2022-03-01

    申请号:CN201911006979.2

    申请日:2019-10-22

    Inventor: 刘凡 张格皓

    Abstract: 本说明书实施例提供一种分类模型的训练方法和装置。方法包括:获取第一领域的第一样本集合,包括多个第一训练样本,每个第一训练样本包括样本输入和对应的第一分类任务的类别标签;获取第二领域的第二样本集合,包括多个第二训练样本,每个第二训练样本包括样本输入和对应的第二分类任务的类别标签;两个分类任务的类别标签具有映射关系;将第二样本集合中的多个第二训练样本加入第一样本集合,并根据映射关系,将第二训练样本包括的第二分类任务的类别标签转换为第一分类任务的类别标签,得到第三样本集合;将第三样本集合中的样本输入输入待训练的分类模型,以针对第一分类任务训练所述分类模型。能够获得令人满意的训练效果。

    代码检测处理方法及装置
    2.
    发明公开

    公开(公告)号:CN117762806A

    公开(公告)日:2024-03-26

    申请号:CN202311826968.5

    申请日:2023-12-27

    Inventor: 张格皓 姜伟

    Abstract: 本说明书实施例提供了代码检测处理方法及装置,其中,一种代码检测处理方法包括:一方面基于待检测代码的语法树确定待检测代码的语法特征,另一方面计算待检测代码的代码指标,并对代码指标进行转换处理获得指标特征,在此基础上,结合语法特征和指标特征进行特征解析处理,获得待检测代码的代码特征,根据待检测代码的代码特征,在代码库中检测待检测代码的关联代码的代码信息。

    风险识别方法、装置和电子设备

    公开(公告)号:CN114612104A

    公开(公告)日:2022-06-10

    申请号:CN202011448997.9

    申请日:2020-12-09

    Abstract: 本说明书实施例提出了一种风险识别方法、装置和电子设备,其中,上述风险识别方法中,获取至少两个数据源的数据,以及获取上述数据所属数据源的渠道标识之后,对获取的数据进行文本转换,将上述数据中的文本转换为句向量,并对上述渠道标识进行嵌入处理,获得上述渠道标识对应的渠道向量,然后将转换获得的句向量与上述渠道向量进行交互合并,最后对合并获得的向量进行识别,获得上述数据反馈的风险所属的风险类别。从而可以实现对电子支付平台的用户反馈进行监控,确定从数据源获取的数据所反馈风险的风险类别,为后续进一步确定风险问题做好准备,进而可以帮助线上业务及时感知电子支付平台的问题。

    代码补全方法及装置
    4.
    发明公开

    公开(公告)号:CN119201121A

    公开(公告)日:2024-12-27

    申请号:CN202411217808.5

    申请日:2024-08-30

    Abstract: 本说明书实施例提供一种代码补全方法及装置,在代码补全方法中,获取当前代码文件中待补全的当前代码片段。在代码关系图中查询与当前代码片段相匹配的目标节点,该代码关系图根据代码库中多个代码文件构建,该多个代码文件包括不同于当前代码文件的其他代码文件。代码关系图中的单个节点代表对应于代码片段的代码实体,节点之间的连接边代表代码实体之间的语义关联。根据目标节点的邻居节点对应的第一代码片段,确定当前代码片段的代码上下文。将当前代码片段和代码上下文输入代码大模型,使其基于代码上下文生成当前代码片段的补全结果。

    文本预处理方法、分类方法、装置及设备

    公开(公告)号:CN111143551A

    公开(公告)日:2020-05-12

    申请号:CN201911228510.3

    申请日:2019-12-04

    Inventor: 刘凡 张格皓

    Abstract: 本说明书实施例提供一种文本预处理方法、分类方法、装置及设备。在获取待处理文本后,可以判断待处理文本的长度是否大于指定长度,如果大于,则以待处理文本中至少一个指定字符作为位置参考,从文本中截取出多个字符,并将截取的字符拼接,得到长度等于指定长度的新文本,然后用新文本对预设的语言模型进行训练。通过对长文本进行截断拼接,可以从长文本中截取表示核心内容的关键字符,拼接得到长度满足语言模型要求的新文本,再通过新文本对语言模型进行训练,使得长文本可以得到模型的支持,且通过模型对长文本中的核心内容的学习,提升了模型的性能,使得训练得到的语言模型在对文本进行分类时具有更高的准确率。

    风险识别方法、装置和电子设备

    公开(公告)号:CN114612104B

    公开(公告)日:2024-08-13

    申请号:CN202011448997.9

    申请日:2020-12-09

    Abstract: 本说明书实施例提出了一种风险识别方法、装置和电子设备,其中,上述风险识别方法中,获取至少两个数据源的数据,以及获取上述数据所属数据源的渠道标识之后,对获取的数据进行文本转换,将上述数据中的文本转换为句向量,并对上述渠道标识进行嵌入处理,获得上述渠道标识对应的渠道向量,然后将转换获得的句向量与上述渠道向量进行交互合并,最后对合并获得的向量进行识别,获得上述数据反馈的风险所属的风险类别。从而可以实现对电子支付平台的用户反馈进行监控,确定从数据源获取的数据所反馈风险的风险类别,为后续进一步确定风险问题做好准备,进而可以帮助线上业务及时感知电子支付平台的问题。

    计算机执行的文本分析方法及装置

    公开(公告)号:CN110705251B

    公开(公告)日:2023-06-16

    申请号:CN201910974127.6

    申请日:2019-10-14

    Abstract: 本说明书实施例提供一种计算机执行的文本分析方法。该方法包括:首先,获取待分析的目标文本;接着,查询缓存中是否存在与所述目标文本匹配的匹配文本,其中所述缓存中至少在初始状态存储有多个历史文本和对应的多个文本标签;然后,在不存在所述匹配文本的情况下,将所述目标文本输入文本分析模型中,得到针对所述目标文本的文本分析结果,所述文本分析模型基于所述多个历史文本和对应的多个文本标签而预先训练;再接着,将所述目标文本和所述文本分析结果关联存储至所述缓存中。

    分类模型的训练方法和装置

    公开(公告)号:CN110728328A

    公开(公告)日:2020-01-24

    申请号:CN201911006979.2

    申请日:2019-10-22

    Inventor: 刘凡 张格皓

    Abstract: 本说明书实施例提供一种分类模型的训练方法和装置。方法包括:获取第一领域的第一样本集合,包括多个第一训练样本,每个第一训练样本包括样本输入和对应的第一分类任务的类别标签;获取第二领域的第二样本集合,包括多个第二训练样本,每个第二训练样本包括样本输入和对应的第二分类任务的类别标签;两个分类任务的类别标签具有映射关系;将第二样本集合中的多个第二训练样本加入第一样本集合,并根据映射关系,将第二训练样本包括的第二分类任务的类别标签转换为第一分类任务的类别标签,得到第三样本集合;将第三样本集合中的样本输入输入待训练的分类模型,以针对第一分类任务训练所述分类模型。能够获得令人满意的训练效果。

    计算机执行的文本分析方法及装置

    公开(公告)号:CN110705251A

    公开(公告)日:2020-01-17

    申请号:CN201910974127.6

    申请日:2019-10-14

    Abstract: 本说明书实施例提供一种计算机执行的文本分析方法。该方法包括:首先,获取待分析的目标文本;接着,查询缓存中是否存在与所述目标文本匹配的匹配文本,其中所述缓存中至少在初始状态存储有多个历史文本和对应的多个文本标签;然后,在不存在所述匹配文本的情况下,将所述目标文本输入文本分析模型中,得到针对所述目标文本的文本分析结果,所述文本分析模型基于所述多个历史文本和对应的多个文本标签而预先训练;再接着,将所述目标文本和所述文本分析结果关联存储至所述缓存中。

Patent Agency Ranking