训练学生图文对比模型的方法、装置、介质及电子设备

    公开(公告)号:CN119830997A

    公开(公告)日:2025-04-15

    申请号:CN202411873895.X

    申请日:2024-12-18

    Abstract: 本说明书实施例公开了一种用于训练学生图文对比模型的方法、装置、介质及电子设备,将无标签的第一图像数据输入已训练的教师图文对比模型,获得所述第一图像数据对应的第一输出结果;将所述第一图像数据与对应的可训练的第一图像提示词输入与所述教师图文对比模型对应的学生图文对比模型中的图像编码器,获得其输出的目标图像特征;将所述目标图像特征与所述已训练的教师图文对比模型在其训练过程中预存储的文本特征相乘,获得所述第一图像数据对应的第二输出结果;使得所述学生图文对比模型根据所述第一输出结果及所述第二输出结果进行知识蒸馏,获得已训练的学生图文对比模型。

    用于阻止机器流量的方法和系统

    公开(公告)号:CN115065644B

    公开(公告)日:2024-08-06

    申请号:CN202210697516.0

    申请日:2022-06-20

    Abstract: 本公开涉及一种用于阻止针对应用的机器流量的系统和方法。该系统包括:流量接收模块,所述流量接收模块被配置成接收针对所述应用的流量以及与发出所述流量的设备相关联的终端实时特征;流量分析模块,所述流量分析模块被配置成基于所述终端实时特征来分析所接收到的流量以确定所述流量是否是机器流量;以及阻挡模块,所述阻挡模块被配置成在所述流量是机器流量的情况下阻止所述流量。

    一种模型训练方法、装置及设备

    公开(公告)号:CN114662706B

    公开(公告)日:2024-07-12

    申请号:CN202210296231.6

    申请日:2022-03-24

    Abstract: 本说明书实施例公开了一种模型训练方法、装置及设备,该方法应用于终端设备,包括:获取用于训练目标模型的样本数据,该样本数据不包含用于训练目标模型的标签信息,然后,根据预设的节点选取次数,每次从目标模型中包含的模型节点中选取满足预设丢弃概率的模型节点,并从目标模型中去除选取的模型节点,得到剩余模型节点构成的目标模型,将该样本数据输入到上述每个目标模型中进行特征提取处理,得到每个目标模型对应的样本特征,向该样本特征中分别加入预设的噪声数据,得到噪声样本特征,将该噪声样本特征发送给服务器,以触发服务器基于该噪声样本特征对目标模型进行联邦训练。

    模型计算方法和装置
    5.
    发明授权

    公开(公告)号:CN114090243B

    公开(公告)日:2024-06-18

    申请号:CN202111327329.5

    申请日:2021-11-10

    Abstract: 本说明书实施例提供了模型计算方法和装置。该方法中,从终端设备上获取用于模型计算的第一特征数据;从服务器上获取用于模型计算的特征计算结果;其中,特征计算结果是所述服务器根据该服务器获取的用于模型计算的第二特征数据计算得到的;利用所述第一特征数据以及所述特征计算结果进行所述模型的计算。本说明书能够更好地进行模型计算,更好地满足业务需求。

    一种模型的防盗取检测方法、装置、存储介质及电子设备

    公开(公告)号:CN117592056A

    公开(公告)日:2024-02-23

    申请号:CN202311564982.2

    申请日:2023-11-21

    Abstract: 本说明书公开了一种模型的防盗取检测方法、装置、存储介质和电子设备,防盗取检测模型包括克隆器及生成器,克隆器用于克隆预先训练的业务模型,生成器用于生成输入所述克隆器的仿真业务数据。先将噪声输入生成器,获得第一仿真业务数据,并通过克隆器获得第一仿真业务数据的第一业务结果。再根据第一业务结果及第一仿真业务数据,以提高克隆器输出结果的错误率为训练目标,对生成器进行训练。接着,将噪声输入训练后的生成器,获得第二仿真业务数据,通过克隆器及业务模型获得第二仿真业务数据的第二业务结果及标签。最后,根据第二业务结果及标签,对克隆器进行训练,利用训练过程中的克隆器的迭代次数,检测业务模型的防盗取能力。

    一种数据的处理方法、装置及设备

    公开(公告)号:CN117290735A

    公开(公告)日:2023-12-26

    申请号:CN202311140828.2

    申请日:2023-09-05

    Inventor: 施玮 傅欣艺 傅幸

    Abstract: 本说明书实施例公开了一种数据的处理方法、装置及设备,该方法包括:获取预设时长内多个不同用户触发目标业务执行的过程中产生的行为序列数据,然后,可以确定能够表征每个行为序列数据的表征信息,基于确定的多个表征信息对行为序列数据进行聚类处理,得到一个或多个不同的聚类簇,之后,可以将相似度大于预设相似度阈值的行为序列数据对应的操作目的信息和操作意图信息,以及属于同一个聚类簇的行为序列数据作为提示信息,将该提示信息和得到的聚类簇输入到语言模型中,得到不同的聚类簇对应的操作行为的理解信息和/或意图信息,进而可以确定不同的聚类簇对应的类别标签信息。

    一种模型训练的方法、装置、存储介质以及电子设备

    公开(公告)号:CN114943307A

    公开(公告)日:2022-08-26

    申请号:CN202210752076.4

    申请日:2022-06-28

    Inventor: 傅欣艺

    Abstract: 本说明书公开了一种模型训练的方法、装置、存储介质以及电子设备,采集设定时间内线上业务的业务数据,并构建业务数据集,而后,根据业务数据集和训练风控模型时所使用的样本数据集,对预设的分类模型进行训练,该分类模型用于判断输入的数据属于所述业务数据集和所述样本数据集中的哪一数据集,继而,确定训练后的分类模型的训练质量程度,并根据训练质量程度,确定业务数据集和样本数据集在整体上的区分度,以及根据区分度,对该风控模型进行训练,以通过训练后的风控模型对线上用户进行风控。可以看出,该方法间接地通过训练分类模型的训练质量,来确定业务数据集和样本数据集的样本分布存在多大的区别,提高通过风控模型进行风控的准确性。

    风险识别系统的更新方法及装置、风险识别方法及装置

    公开(公告)号:CN112785157B

    公开(公告)日:2022-07-22

    申请号:CN202110093517.X

    申请日:2021-01-22

    Abstract: 本说明书实施例提供一种风险识别方法。该方法包括:获取待识别的第一事件样本;将该第一事件样本输入针对多个风险域的风险识别系统中;该风险识别系统包括第一表征层,第二表征层和输出层;该第二表征层包括共享表征子层,以及对应该多个风险域的多个特定表征子层;该输出层包括对应该多个风险域的多个输出子层;其中,该第一表征层基于该第一事件样本的事件特征,确定该第一事件样本的第一表征向量;该第二表征层中的各个表征子层各自基于该第一表征向量,确定该第一事件样本的表征子向量;该输出层中的各个输出子层,各自基于所对应风险域的表征子向量和该共享表征子层确定出的表征子向量,确定风险预测结果。

Patent Agency Ranking