一种基于隐私保护的模型训练方法及装置

    公开(公告)号:CN114357517A

    公开(公告)日:2022-04-15

    申请号:CN202111683309.1

    申请日:2021-12-30

    Abstract: 本说明书实施例提供一种基于隐私保护的模型训练方法及装置,获得用于训练目标业务模型的初始事件序列集合;针对所述初始事件序列集合中的各初始事件序列,根据第一增强策略的策略信息,基于预设的用于进行数据扰动修改的多个数据增强单元,对该初始事件序列进行第一数目的数据增强操作,得到对应的增强事件序列,其中,一次数据增强操作利用一个数据增强单元执行;策略信息至少指示所述第一数目;利用各增强事件序列形成的第一增强序列集合进行模型训练,得到隐私保护的第一业务模型。

    建立表征提取模型、表征提取、类型识别的方法和装置

    公开(公告)号:CN113988225A

    公开(公告)日:2022-01-28

    申请号:CN202111597741.9

    申请日:2021-12-24

    Abstract: 本说明书实施例提供了一种建立表征提取模型、表征提取、类型识别的方法和装置。根据该实施例的方法,首先获取包含一个以上样本对的第一训练数据,样本对包括正样本对和负样本对;然后利用第一训练数据训练第一表征提取模型和第二表征提取模型,其中第一表征提取模型用以利用用户的终端侧特征提取用户的终端侧表征向量,第二表征提取模型用以利用用户的服务器侧特征提取用户的服务器侧表征向量;训练目标为最大化正样本对的终端侧表征向量与服务器侧表征向量之间的相似度且最小化负样本对的终端侧表征向量与服务器侧表征向量之间的相似度;再将训练得到的第一表征提取模型部署于终端设备。

    训练标签预测模型的方法、标签预测方法和装置

    公开(公告)号:CN113902256A

    公开(公告)日:2022-01-07

    申请号:CN202111059586.5

    申请日:2021-09-10

    Abstract: 本说明书实施例提供了一种训练标签预测模型的方法、标签预测方法和装置。首先获取样本集合,所述样本集合中的各样本包括对象的特征数据以及对该对象标注的标签;然后从所述样本集合中确定支持集合和查询集合;再利用所述支持集合和查询集合训练标签预测模型;其中,将所述支持集合和查询集合中的查询样本输入所述标签预测模型,由所述标签预测模型利用输入的查询样本与支持集合中各支持样本之间的特征相似度以及各支持样本的标签,预测输入的查询样本的标签;训练目标为最小化预测结果与查询样本被标注的标签之间的差异。

    一种检索库优化的方法、装置及设备

    公开(公告)号:CN117093608A

    公开(公告)日:2023-11-21

    申请号:CN202311016080.5

    申请日:2023-08-10

    Abstract: 本说明书一个或多个实施例公开了一种检索库优化的方法、装置及设备。所述方法包括:将检索库中的检索元素和查询库中的查询元素之间的相似度进行映射,得到各个所述检索元素对所述查询元素对应的检索得分的贡献值;根据所述贡献值,确定表征所述查询元素的检索得分和各个所述检索元素的保留概率之间的映射关系;基于所述映射关系,在最小化第一损失函数的过程中,确定每个所述检索元素对应的保留概率,所述第一损失函数用于表征所述查询元素对应的检索得分和分类标签之间的残差;根据所述保留概率,确定所述检索库中每个所述检索元素是否保留的去留指示,以对所述检索库进行更新。

    数据增强方法、系统、可读存储介质及电子设备

    公开(公告)号:CN117077807A

    公开(公告)日:2023-11-17

    申请号:CN202311003664.9

    申请日:2023-08-10

    Abstract: 本说明书涉及一种数据增强方法及系统,方法包括:获取两个用户行为序列;将两个用户行为序列均调整为预设长度;从预设长度的第一用户行为序列中选择若干个第一事件,作为各待替换第一事件;将预设长度的第一用户行为序列中的各待替换第一事件替换为所述预设长度的第二用户行为序列中的相应位置的各第二事件,得到第三用户行为序列;获取第三用户行为序列的第三风险结果,以通过第三用户行为序列和第三风险结果对机器学习模型进行训练。本说明书的数据增强方法及系统,基于两个不定长的用户行为序列生成新的用户行为序列,从而增加样本量。

    一种风险识别模型训练方法、装置、存储介质及电子设备

    公开(公告)号:CN116843466A

    公开(公告)日:2023-10-03

    申请号:CN202310867749.5

    申请日:2023-07-13

    Abstract: 本说明书公开了一种风险识别模型训练方法、装置、存储介质和电子设备,所述方法包括:确定历史上用户的各交易事件为各训练样本,以及将各交易事件对应的风险情况作为各训练样本分别对应的标注。然后,确定待训练的风险识别模型中的各参数类型,并根据各参数类型,确定参数类型为指定类型的参数,作为指定参数。再根据各训练样本分别对应的标注,确定所述指定参数的参数值。然后,根据参数值对待训练的风险识别模型进行初始化,并根据各训练样本以及各标注,对初始化后的待训练的风险识别模型进行训练,提高风险识别模型的收敛速度,提升风险识别模型的训练效率,节约训练风险识别模型的资源。

    风险识别方法及装置
    39.
    发明公开

    公开(公告)号:CN116843181A

    公开(公告)日:2023-10-03

    申请号:CN202310865083.X

    申请日:2023-07-13

    Abstract: 本说明书实施例提供了风险识别方法及装置,其中,一种风险识别方法包括:将用户的操作事件的事件数据分别与各历史操作事件的历史事件数据进行特征卷积处理,获得第一卷积特征,以及将事件数据对中包含的两个历史事件数据进行特征卷积处理,获得第二卷积特征,采用注意力机制对第一卷积特征和第二卷积特征进行特征提取,获得目标特征,将目标特征、操作事件的事件特征以及关键特征进行特征拼接,获得识别特征,并基于识别特征对操作事件进行风险识别,获得风险识别结果。

    对表格数据和序列数据融合处理的方法和装置

    公开(公告)号:CN116578579A

    公开(公告)日:2023-08-11

    申请号:CN202310500448.9

    申请日:2023-05-04

    Abstract: 本说明书实施例提供一种对表格数据和序列数据融合处理的方法和装置。方法包括:将表格数据输入表格编码器,得到表格嵌入向量;将序列数据输入序列编码器,得到初始嵌入矩阵,序列数据包括与目标对象相关、按照时序排列的t个事件的事件数据,初始嵌入矩阵由t个事件分别对应的初始事件嵌入向量按照时序排列而成;将表格嵌入向量和初始嵌入矩阵进行目标拼接处理,得到拼接嵌入矩阵;拼接嵌入矩阵由m个事件分别对应的拼接事件嵌入向量按照时序排列而成;将拼接嵌入矩阵输入自注意力层,得到融合嵌入矩阵;融合嵌入矩阵用于对目标对象进行检索或分类。能够使得对目标对象进行检索或分类取得良好的效果。

Patent Agency Ranking