一种模型训练、业务风控方法、装置、存储介质及设备

    公开(公告)号:CN118194974A

    公开(公告)日:2024-06-14

    申请号:CN202410384323.9

    申请日:2024-03-29

    Abstract: 本说明书公开一种模型训练、业务风控方法、装置、存储介质及设备,在下游设备端,可以通过使每个下游设备将本地存储的图数据蒸馏到统一的基础图数据上,得到目标图数据,从而可以避免由于各个下游设备所使用的本地任务图数据之间的图异质性问题而导致联邦训练效果差的情况发生,以及,在中心服务器端,可以通过中心服务器根据每个下游设备返回的目标图数据与其他下游设备返回的目标图数据之间的相关性,将每个下游设备的模型参数与其他下游设备的模型参数进行聚合,以为每个下游设备确定一套个性化的目标模型参数,以使每个下游设备根据各自对应的目标模型参数对本地模型进行更新,进而可以提升联邦训练的训练效果。

    一种基于隐私推理的神经网络模型确定方法和装置

    公开(公告)号:CN118194928A

    公开(公告)日:2024-06-14

    申请号:CN202410384543.1

    申请日:2024-03-29

    Abstract: 本说明书实施例公开了一种基于隐私推理的神经网络模型确定方法和装置,确定隐私推理模型所需进行的隐私推理任务类型,根据隐私推理任务类型,确定密态数据集和明文态数据集,以及包含各候选子结构的搜索空间,通过神经网络架构搜索,在搜索空间中搜索用于构成隐私推理模型的各候选子结构,并确定由搜索到的各候选子结构构成的初始神经网络模型。根据明文态数据集,确定初始神经网络模型的准确度损失,并,根据密态数据集,确定初始神经网络模型进行隐私推理任务类型对应的任务时对应的运算开销损失,根据准确度损失和运算开销损失,对初始神经网络模型进行优化,直至初始神经网络模型满足预设条件时,将初始神经网络确定为隐私推理模型。

    一种模型的处理方法、装置及设备
    123.
    发明公开

    公开(公告)号:CN118070922A

    公开(公告)日:2024-05-24

    申请号:CN202410276169.3

    申请日:2024-03-11

    Abstract: 本说明书实施例公开了一种模型的处理方法、装置及设备,该方法包括:获取多个不同模态的模态数据,将多个不同模态的模态数据分别输入到表征模型中相应的模态编码器中,得到每种模态的模态数据对应的第一数据表征,基于不同模态的模态数据对应的第一数据表征,通过对比学习的方式和预设的第一损失函数,确定第一损失信息,通过表征模型将不同模态的模态数据对应的第一数据表征进行表征融合处理,并将融合后的数据表征输入表征模型中的表征增强子模型中,基于表征增强子模型的输出结果和多个不同模态的模态数据对应的标签信息,通过预设的第二损失函数,确定第二损失信息,基于第一损失信息和第二损失信息对表征模型进行预训练。

    一种风险识别的方法、装置、存储介质及电子设备

    公开(公告)号:CN117575611A

    公开(公告)日:2024-02-20

    申请号:CN202311636825.8

    申请日:2023-11-30

    Abstract: 本说明书公开了一种风险识别的方法、装置、存储介质和电子设备,包括:从所有风险类型中确定当前业务场景所需识别的风险类型为各待识别类型,确定各待识别类型对应的配置信息。在预先训练的风险识别模型中,确定各待识别类型对应的各目标参数。根据配置信息,调整各目标参数,确定目标识别模型。确定待识别用户的信息,将信息输入目标识别模型,确定待识别用户的风险识别结果。根据风险识别结果,对待识别用户进行风险控制。通过当前场景下的各待识别类型的配置信息,对风险识别模型中各待识别类型对应的模型参数进行调整,并使用目标识别模型对待识别用户进行风险识别,可以控制模型输出的风险类型,灵活地适用于各种业务场景下的风险识别。

    一种模型训练的方法及装置
    125.
    发明公开

    公开(公告)号:CN117436512A

    公开(公告)日:2024-01-23

    申请号:CN202311310665.8

    申请日:2023-10-08

    Abstract: 本说明书公开了一种模型训练的方法及装置,用于隐私保护,第一计算节点可以将本地第一图数据输入到本地预测模型中,以通过该预测模型中包含的若干图卷积层,得到中间层特征矩阵,并输入到之后的目标卷积层中,得到目标特征矩阵,向第二计算节点发送中间层特征矩阵,第二计算节点将中间层特征矩阵输入到本地预测模型中包含的与目标卷积层对应的卷积层中,得到聚合矩阵并返回给第一计算节点,而后通过第二计算节点返回的聚合矩阵对目标特征矩阵进行更新,得到更新后矩阵,进而确定基于更新后矩阵的预测结果,以对第一计算节点本地预测模型进行训练,从而实现不同计算节点拥有不同业务类型的图数据的情况下的联邦学习,提高了业务执行的准确率。

    一种异常检测方法、装置、设备及可读存储介质

    公开(公告)号:CN117313141A

    公开(公告)日:2023-12-29

    申请号:CN202311147658.0

    申请日:2023-09-06

    Abstract: 本说明书公开了一种异常检测方法、装置、设备及可读存储介质,确定在异常检测时刻包含待检测对象的目标拓扑图,根据目标拓扑图中与待检测对象通过边连接的邻居节点、待检测对象以及待检测对象与邻居节点之间的边,确定待检测对象的目标特征,基于待检测对象的目标特征,确定待检测对象在异常检测时刻的异常检测结果。基于在异常检测时刻的目标拓扑图确定待检测对象的目标特征,利用随时间变化的邻居节点的信息,以及随时间变化的待检测对象与邻居节点之间的边的信息,汇总动态变化的图结构和时序信息,从而得到待检测对象在异常检测时刻的异常检测结果,从而基于异常检测结果判断待检测对象是否存在异常,保证了线上业务和隐私数据的安全性。

    一种模型训练方法、装置、设备及可读存储介质

    公开(公告)号:CN117151250A

    公开(公告)日:2023-12-01

    申请号:CN202311008652.5

    申请日:2023-08-10

    Abstract: 本说明书公开了一种模型训练方法、装置、设备及可读存储介质,第一节点在接收到第二节点发送的第二训练样本的特征时,将第二训练样本的特征写入记忆组件,在通过第一编码器确定第一训练样本的特征时,根据第一训练样本的特征从记忆组件中读取与第一训练样本的特征存在关联关系的目标特征,从而将目标特征和第一训练样本的特征输入分类器,得到第一训练样本的预测结果,基于第一训练样本的预测结果和标注训练目标模型。可见,上述方案基于联邦学习的思想,通过记忆组件存储来自第二节点的特征,在目标模型的训练过程中有效利用第二训练样本的信息的同时,并保证了第二训练样本和第一训练样本的隐私安全,提高了模型的隐私安全性和准确性。

    短文本实体识别方法和系统

    公开(公告)号:CN112528653B

    公开(公告)日:2023-11-28

    申请号:CN202011398845.2

    申请日:2020-12-02

    Abstract: 本公开提供了一种短文本实体识别方法,包括:获取短文本并对该短文本进行分词;对经分词的短文本进行词向量训练,以生成词向量序列;基于对抗性框架对该词向量序列中的各个词向量进行词性表征学习,以获取该词向量的词性特征;提取该词向量序列中的各个词向量的局部上下文特征以及各个词向量之间的全局语义特征;以及使用词性特征、局部上下文特征和全局语义特征识别实体。

    一种模型训练的方法、装置、存储介质及电子设备

    公开(公告)号:CN117113174A

    公开(公告)日:2023-11-24

    申请号:CN202311008790.3

    申请日:2023-08-10

    Abstract: 本说明书公开了一种模型训练的方法、装置、存储介质及电子设备,获取样本数据,将样本数据输入待训练的机器学习模型,得到样本特征。针对每个样本特征,确定该样本特征的信息量,确定该样本特征与目标任务的相关性,根据各样本特征的信息量以及各样本特征与目标任务的相关性,确定各样本特征的评估值,根据各样本特征的评估值,对各样本特征进行选择,得到最终样本特征。根据最终样本特征,对待训练的机器学习模型进行训练。实现了对机器学习模型的样本特征的选择,使得选取到的样本特征与目标任务相关性高的同时包含的信息量大,减少训练时间,降低机器学习模型对硬件设备计算资源以及存储资源的要求,提高机器学习模型的性能。

    保护数据隐私的向量检索方法及装置

    公开(公告)号:CN117093621A

    公开(公告)日:2023-11-21

    申请号:CN202311008506.2

    申请日:2023-08-10

    Abstract: 本说明书实施例披露一种保护数据隐私的向量检索方法及装置。该方法包括:第一方基于待检索的目标向量执行多次旋转操作,得到多个第一旋转向量,并对其中位于相同位置元素所组成的向量分别进行同态加密,得到第一密文集;第一方向第二方发送第一密文集和相似度阈值;第二方基于第一密文集、相似度阈值和第二编码集进行同态运算,得到检索结果密文,其中第二编码集是预先基于多个候选向量分别执行旋转操作,得到对应的多个第二旋转向量后,对其中位于相同位置元素所组成的向量分别进行同态加密中的编码处理而得到;第一方对接收到的检索结果密文进行同态解密,得到检索结果明文,其指示各个候选向量与目标向量之间的相似度是否大于相似度阈值。

Patent Agency Ranking