一种后门样本检测方法、系统及装置

    公开(公告)号:CN111222588B

    公开(公告)日:2020-08-07

    申请号:CN202010329693.4

    申请日:2020-04-24

    Inventor: 任彦昆

    Abstract: 本说明书实施例公开了一种后门样本检测方法、系统及装置。所述方法包括:获取多个训练样本,以及基于所述多个训练样本确定的目标模型;其中,所述多个训练样本属于至少两个样本类别;对于任一个样本类别:分别将该样本类别中的各训练样本输入到所述目标模型中,得到所述目标模型对各训练样本的响应数据;基于各训练样本对应的响应数据,确定反映各响应数据整体分布的特征数据;将各训练样本对应的响应数据分别与所述特征数据进行比较,得到多个比较结果;对所述多个比较结果进行分析,确定该样本类别中的训练样本中是否包含后门样本。由此,可以在不需要标注数据的前提下,检测样本是否包含后门样本,防止模型被后门样本污染,提高模型准确率。

    序列推荐方法和装置
    2.
    发明公开

    公开(公告)号:CN118779529A

    公开(公告)日:2024-10-15

    申请号:CN202410970177.8

    申请日:2024-07-18

    Inventor: 任彦昆 李龙飞

    Abstract: 本说明书实施例提供一种序列推荐方法和装置。方法包括:获取用户历史交互的多个对象构成的对象序列;对象具有对象标识和对应于若干项基础属性特征的第一特征信息;利用对象序列中任一对象的第一特征信息构造提示文本,将提示文本输入大语言模型,得到该对象的文本描述信息;文本描述信息至少包括对应于扩展属性特征的第二特征信息;确定对象序列中各个对象分别具有的对象标识对应的第一嵌入表示,以及确定各个对象分别具有的文本描述信息对应的第二嵌入表示;将对象序列中各个对象分别对应的第一嵌入表示和第二嵌入表示输入序列推荐模型中,得到向用户推荐的目标对象。能够提升推荐的准确性。

    利用对抗生成网络生成对抗样本的方法及装置

    公开(公告)号:CN111241291B

    公开(公告)日:2023-01-03

    申请号:CN202010329630.9

    申请日:2020-04-24

    Inventor: 任彦昆

    Abstract: 本说明书实施例提供一种利用对抗生成网络生成对抗样本的方法,其中对抗生成网络包括:预先训练好的、用于针对业务对象执行N分类任务的分类器,用于生成对应于各类别真实样本的模拟样本的生成器,以及对应于N个类别的N个判别器,其中第i个判别器用于判别输入其中的样本是否属于第i个类别下的真实样本。在该方法中,可以实现对生成器和判别器的训练,进而利用其中训练好的生成器生成具有指定真实类别,但会被上述分类器预测为其他类别的对抗样本,同时,可以实现高效、快捷地生成大批量的优质对抗样本。

    后门样本的检测方法、装置和电子设备

    公开(公告)号:CN111291901B

    公开(公告)日:2020-08-14

    申请号:CN202010334280.5

    申请日:2020-04-24

    Inventor: 任彦昆

    Abstract: 本说明书实施例提出了一种后门样本的检测方法、装置和电子设备,其中,上述后门样本的检测方法中,获取训练样本中目标类别的样本向量之后,通过预先训练的模型对上述目标类别中的每个样本向量进行分类,获得上述样本向量所属类别最高的概率,然后计算上述概率相对上述样本向量的梯度向量,以及计算上述梯度向量的一范数,接下来,根据上述一范数对目标类别中的样本向量进行聚类,根据聚类结果对上述目标类别中的后门样本进行检测。

    后门样本的检测方法、装置和电子设备

    公开(公告)号:CN111291902A

    公开(公告)日:2020-06-16

    申请号:CN202010334289.6

    申请日:2020-04-24

    Inventor: 任彦昆

    Abstract: 本说明书实施例提出了一种后门样本的检测方法、装置和电子设备,其中,上述后门样本的检测方法中,获取训练样本中目标类别的样本数据之后,通过预先训练的模型对上述目标类别中的每个样本数据进行分类,获得上述样本数据所属类别最高的概率,然后获取上述概率相对上述样本数据的梯度图,将上述梯度图转化为概率分布,以及计算上述样本数据对应上述概率分布的信息熵,接下来,根据上述信息熵对目标类别中的样本数据进行聚类,根据聚类结果对上述目标类别中的后门样本进行检测。

    文本分析模型的训练方法、文本分析方法及装置

    公开(公告)号:CN118626853A

    公开(公告)日:2024-09-10

    申请号:CN202410763384.6

    申请日:2024-06-13

    Abstract: 本说明书一个或多个实施例公开了一种文本分析模型的训练方法、文本分析方法及装置。文本分析模型的训练方法包括:获取第一样本数据集合和第二样本数据集合,第一样本数据集合包括第一样本文本和第一标签信息,第二样本数据集合包括第二样本文本和第二标签信息。在编码器的参数固定的情况下,将第一样本数据集合输入基座模型,对第一样本文本进行文本分析,得到第一分析结果。然后,根据第一分析结果和第一标签信息对待训练的适配器的参数进行调整,得到训练后的适配器。在训练后的适配器的参数固定的情况下,将第二样本数据集合输入基座模型,对第二样本文本进行文本分析,得到第二分析结果。之后,根据第二分析结果和第二标签信息对编码器的参数进行调整,得到目标文本分析模型。

    后门样本的检测方法、装置和电子设备

    公开(公告)号:CN111291902B

    公开(公告)日:2020-08-25

    申请号:CN202010334289.6

    申请日:2020-04-24

    Inventor: 任彦昆

    Abstract: 本说明书实施例提出了一种后门样本的检测方法、装置和电子设备,其中,上述后门样本的检测方法中,获取训练样本中目标类别的样本数据之后,通过预先训练的模型对上述目标类别中的每个样本数据进行分类,获得上述样本数据所属类别最高的概率,然后获取上述概率相对上述样本数据的梯度图,将上述梯度图转化为概率分布,以及计算上述样本数据对应上述概率分布的信息熵,接下来,根据上述信息熵对目标类别中的样本数据进行聚类,根据聚类结果对上述目标类别中的后门样本进行检测。

    一种实体分类方法、系统、及装置

    公开(公告)号:CN111324749A

    公开(公告)日:2020-06-23

    申请号:CN202010409782.X

    申请日:2020-05-15

    Inventor: 任彦昆

    Abstract: 本说明书实施例提供一种实体分类方法、系统及装置,该方法包括:获取待分类实体以及至少一个候选实体类型;确定至少一个候选实体类型各自对应的第一向量表示;确定与待分类实体相关的第二向量表示和至少一个第三向量表示,第二向量表示包括待分类实体的向量表示,至少一个第三向量表示与至少一个候选实体类型一一对应且与待分类实体的上下文相关;针对至少一个候选实体类型中的每一个:基于第二向量表示、该候选实体类型对应的第一向量表示以及该候选实体类型对应的第三向量表示,确定待分类实体与该候选实体类型之间的评估值,从而得到至少一个候选实体类型对应的评估值;基于至少一个候选实体类型对应的评估值,确定待分类实体的目标实体类型。

    后门样本的检测方法、装置和电子设备

    公开(公告)号:CN111242322B

    公开(公告)日:2020-08-14

    申请号:CN202010335295.3

    申请日:2020-04-24

    Inventor: 任彦昆

    Abstract: 本说明书实施例提出了一种后门样本的检测方法、装置和电子设备,其中,上述后门样本的检测方法中,获取待检测的样本之后,利用预先训练的第一模型对上述待检测的样本进行分类,获得上述待检测的样本所属的第一类别,然后获取第一模型对上述待检测的样本进行分类之后获得的第一输出向量,利用预先训练的第二模型对上述第一输出向量进行分类,获得上述第一输出向量所属的第二类别,其中,上述第二类别不同于上述第一类别,最后,利用上述第一模型获得上述待检测的样本分别属于第一类别和第二类别的概率,以及利用上述第二模型获得上述第一输出向量分别属于第一类别和第二类别的概率,根据上述概率,获得上述待检测的样本是否为后门样本的检测结果。

    一种获取对抗样本生成模型的方法和系统

    公开(公告)号:CN111340143A

    公开(公告)日:2020-06-26

    申请号:CN202010409787.2

    申请日:2020-05-15

    Inventor: 任彦昆

    Abstract: 本说明书实施例公开了一种获取对抗样本生成模型的方法和系统,所述方法包括:获取多个训练样本;对于多个训练样本的每一个进行以下处理,迭代更新对抗样本生成模型的参数,获取训练完成的对抗样本生成模型:输入对抗样本生成模型,以获取该训练样本相对应的构造样本;将所述构造样本输入到目标模型,以得到目标模型对所述构造样本的处理结果,并基于所述处理结果确定惩罚值;基于构造样本与其对应的训练样本的差异、以及惩罚值构造第一损失函数;所述第一损失函数与所述差异以及所述惩罚值均正相关;调节对抗样本生成模型的参数,以减小第一损失函数。

Patent Agency Ranking