数据处理方法、装置及设备

    公开(公告)号:CN114969293B

    公开(公告)日:2025-01-03

    申请号:CN202210612033.6

    申请日:2022-05-31

    Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,所述方法包括:获取待识别的目标特征向量,所述目标特征向量由目标用户针对目标业务的交互内容确定,其中,基于所述目标特征向量还原出的内容与所述交互内容不同;基于预先训练的风险话术识别模型对所述目标特征向量进行识别处理,得到针对所述目标特征向量的识别结果,所述风险话术识别模型基于目标风险话术对应的特征向量训练得到,所述目标风险话术对应的特征向量为基于预先训练的风险话术筛选模型,对所述目标业务中存在风险的历史交互内容对应的第一特征向量进行筛选处理得到;基于所述识别结果,确定所述交互内容中是否存在风险话术,以确定触发执行所述目标业务是否存在风险。

    数据处理方法、装置及设备

    公开(公告)号:CN114969293A

    公开(公告)日:2022-08-30

    申请号:CN202210612033.6

    申请日:2022-05-31

    Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,所述方法包括:获取待识别的目标特征向量,所述目标特征向量由目标用户针对目标业务的交互内容确定,其中,基于所述目标特征向量还原出的内容与所述交互内容不同;基于预先训练的风险话术识别模型对所述目标特征向量进行识别处理,得到针对所述目标特征向量的识别结果,所述风险话术识别模型基于目标风险话术对应的特征向量训练得到,所述目标风险话术对应的特征向量为基于预先训练的风险话术筛选模型,对所述目标业务中存在风险的历史交互内容对应的第一特征向量进行筛选处理得到;基于所述识别结果,确定所述交互内容中是否存在风险话术,以确定触发执行所述目标业务是否存在风险。

    一种模型的安全防护方法、装置及设备

    公开(公告)号:CN118469010A

    公开(公告)日:2024-08-09

    申请号:CN202410139966.7

    申请日:2024-01-31

    Abstract: 本说明书实施例公开了一种模型的安全防护方法、装置及设备,该方法包括:获取用户输入到目标语言模型中的问题数据,然后,可以将该问题数据输入到文本编码器中,得到该问题数据对应的问题表征,之后,可以获取针对目标语言模型的一个或多个不同的风险标签中每个风险标签对应的标签表征,该标签表征是在每个风险标签中添加辅助信息后,通过文本编码器生成的表征,最终,可以基于该问题表征与每个风险标签对应的标签表征之间的相似度,确定该问题数据对应的风险标签,并基于该问题数据对应的风险标签执行针对目标语言模型的风险防控处理。

    一种变种文本相似检索的风控方法、装置、介质及设备

    公开(公告)号:CN118227806A

    公开(公告)日:2024-06-21

    申请号:CN202410384521.5

    申请日:2024-03-29

    Abstract: 本说明书公开了一种变种文本相似检索的风控方法、装置、介质及设备,获取已识别出的风险文本。将风险文本进行变种,得到风险文本的变种文本。将风险文本和变种文本输入待训练的提取模型,分别确定风险文本和变种文本的文本特征,并确定风险文本和变种文本的文本特征之间的相似度,以相似度大于预设的相似度阈值为目标,训练提取模型。通过训练完成的提取模型,确定数据库中的风险样本的文本特征,根据风险样本的文本特征进行风控,达到识别并防控变种的风险文本的效果。

    一种语料生成方法及装置

    公开(公告)号:CN113486656B

    公开(公告)日:2023-11-10

    申请号:CN202110808793.X

    申请日:2021-07-16

    Abstract: 本说明书实施例提供了一种语料生成方法及装置,该方法包括:获取原始文本;对原始文本进行关键词匹配,从而确定出原始文本中的违规关键词以及其对应的基本关键词,基本关键词对应于违规关键词的正确形态;确定基本关键词的违规要素,并确定出与基本关键词关于违规要素存在关联的关联关键词;对关联关键词进行文本变种,获取变种文本;以变种文本,替换原始文本中的违规关键词,生成语料文本。

    一种语料生成方法及装置

    公开(公告)号:CN113486656A

    公开(公告)日:2021-10-08

    申请号:CN202110808793.X

    申请日:2021-07-16

    Abstract: 本说明书实施例提供了一种语料生成方法及装置,该方法包括:获取原始文本;对原始文本进行关键词匹配,从而确定出原始文本中的违规关键词以及其对应的基本关键词,基本关键词对应于违规关键词的正确形态;确定基本关键词的违规要素,并确定出与基本关键词关于违规要素存在关联的关联关键词;对关联关键词进行文本变种,获取变种文本;以变种文本,替换原始文本中的违规关键词,生成语料文本。

Patent Agency Ranking