-
公开(公告)号:CN114298327B
公开(公告)日:2025-05-02
申请号:CN202210080568.3
申请日:2022-01-24
Applicant: 深圳前海微众银行股份有限公司
Abstract: 本申请提供了一种联邦学习模型的数据处理方法,应用于第一参与方设备;方法包括:获取第一参与方设备提供的用于训练联邦学习模型的至少一个第一特征;接收第二参与方设备发送的至少一个匿名特征,匿名特征与用于训练联邦学习模型的第二特征相对应;从第一特征及匿名特征中选取至少一个特征,获取各特征对应联邦学习模型的预测结果;基于各特征,构建线性模型的训练样本,并基于训练样本以及预测结果,训练线性模型,得到线性模型收敛时的模型参数;基于模型参数,确定各第一特征对应的第一贡献信息,以及各匿名特征对应的第二贡献信息。通过本申请,能够衡量单条样本中每个特征的贡献信息,同时能够有效减少模型的计算量,提高计算效率。
-
公开(公告)号:CN119830015A
公开(公告)日:2025-04-15
申请号:CN202510017803.6
申请日:2025-01-06
Applicant: 深圳前海微众银行股份有限公司
Abstract: 本申请公开了一种语言模型训练方法、设备、存储介质及计算机程序产品,涉及自然语言处理技术领域,方法包括:第二设备训练小语言模型后,将小语言模型针对于文本数据的第二训练结果发送给第一设备;第一设备确定文本数据归属于对应的第二训练结果满足预设条件的第二设备,并发送第一发送指示信息给第二设备,第二设备发送第一发送指示信息中指示的文本数据的第二概率分布预测结果给第一设备,第一设备基于第二概率分布预测结果优化大语言模型,直到满足预设训练结束条件后,获得训练完成的大语言模型。本申请能在模型训练过程中对第一设备与第二设备之间传递的通信量进行优化。
-
公开(公告)号:CN113657471B
公开(公告)日:2025-02-07
申请号:CN202110874602.X
申请日:2021-07-30
Applicant: 深圳前海微众银行股份有限公司
IPC: G06F18/2431 , G06F18/214 , G06N20/00 , G06N5/01
Abstract: 本申请提供一种多分类梯度提升树的构建方法、装置,包括:获取携带标签的训练样本的预测值;基于预测值及相应的标签,确定用于表征训练样本所对应梯度的多维向量,多维向量的维度数与多分类梯度提升树的标签类别的数量相对应;对多维向量进行隐私保护,得到中间数据,并将中间数据发送至第二参与方设备;接收第二参与方设备发送的分裂点数据,分裂点数据为,第二参与方设备基于中间数据,进行对应多分类梯度提升树的分裂点构建所得到;基于分裂点数据,确定多分类梯度提升树的全局分裂点,并基于全局分裂点,构建多分类梯度提升树。如此,通过一棵能够多输出的多分类梯度提升树执行多分类任务,有效减少了多分类任务中的开销,提高了训练效率。
-
公开(公告)号:CN111324608B
公开(公告)日:2025-02-07
申请号:CN202010095677.3
申请日:2020-02-14
Applicant: 深圳前海微众银行股份有限公司
IPC: G06N20/00
Abstract: 本发明公开了一种模型复用方法、装置、设备及存储介质,该方法包括:接收待复用模型和目标数据表,并获取模型复用方式;运行所述待复用模型,由所述待复用模型基于所述模型复用方式对所述目标数据表进行处理;运行成功后获得处理结果,并输出所述处理结果。由此,通过模型复用,增强了复用模型与原模型的联系、提高了同步性和模型复用效率。
-
公开(公告)号:CN110751294B
公开(公告)日:2025-02-07
申请号:CN201911050891.0
申请日:2019-10-31
Applicant: 深圳前海微众银行股份有限公司
Abstract: 本发明公开了一种联合多方特征数据的模型预测方法、装置、终端设备及计算机可读存储介质,通过获取所述需求方发起的模型预测任务,并确定处理所述模型预测任务所需的多方特征数据;联合需求方和多方特征数据对应的各数据提供方进行线性回归计算,得到需求方和各数据提供方各自的本地计算结果;计算各本地计算结果的范数之和,并在检测到范数之和小于范数阈值时,对各本地计算结果进行优化处理;将优化处理后的本地计算结果反馈至需求方和各数据提供方,以供需求方和各数据提供方进行本地模型参数更新。本发明在确保需求方与多个数据提供方相互之间不泄露各自特征信息的前提下建立模型,并进行有效的模型预测。
-
公开(公告)号:CN110807528B
公开(公告)日:2024-11-05
申请号:CN201911046722.X
申请日:2019-10-30
Applicant: 深圳前海微众银行股份有限公司
Abstract: 本发明公开了一种特征相关性计算方法、设备及计算机可读存储介质,所述方法包括:接收第一设备发送的加密特征数据,第一设备对第一特征数据进行归一化处理,并对处理结果进行加密得到加密特征数据;对第二特征数据进行归一化处理,并对处理结果进行加随机数操作得到加随机数特征数据;根据加密特征数据和加随机数特征数据计算得到加密相关值,并将加密相关值发送给第一设备,以供第一设备对加密相关值进行解密得到第一特征数据和第二特征数据的相关值。本发明通过一方对数据采取加密措施,另一方对数据采取加随机数措施,双方都采取一定的加密保护措施,使得双方都无法窃取对方的数据,从而增强了纵向联邦学习建模的安全性。
-
公开(公告)号:CN110825476B
公开(公告)日:2024-11-01
申请号:CN201911057310.6
申请日:2019-10-31
Applicant: 深圳前海微众银行股份有限公司
Abstract: 本发明公开了一种联邦学习工作流界面的显示方法、装置、终端设备及计算机可读存储介质,通过在联邦学习工作流发起时,生成所述联邦学习工作流的可视化界面;检测所述可视化界面的输出对象,根据所述输出对象调整所述可视化界面的输出显示状态;将调整输出显示状态后的可视化界面输出显示给所述输出对象。本发明使得在对多方参与的联邦学习工作流进行展示时,针对不同参与方显示可视化界面不同的输出显示状态,保证了每个参与方的机器学习过程不会被其他参与方所知晓,从而达成了在展示联邦学习工作流的过程中,也对联邦学习各参与方数据隐私和数据安全进行保护的目的。
-
公开(公告)号:CN112949764B
公开(公告)日:2024-10-29
申请号:CN202110361982.7
申请日:2021-04-02
Applicant: 深圳前海微众银行股份有限公司
Abstract: 本公开提供一种数据聚类方法、装置、设备及存储介质,该方法通过接收来自发起方的距离值集合以及参与方的距离值集合,其中,发起方的距离值集合包括发起方的用户集合中两两用户的第一特征数据的距离值,参与方的距离值集合包括参与方的用户集合中两两用户的第二特征数据的距离值,发起方和参与方的用户集合相同,第一特征数据与第二特征数据不同。根据接收到的发起方的距离值集合以及参与方的距离值集合,确定用户集合中每一个用户的聚类结果,将每一个用户的聚类结果返回至发起方和参与方。上述方案协同发起方和参与方的重叠用户的数据特征,综合考虑各方用户的特征数据,得到的用户聚类结果更加准确,从而提升各方的整体性能。
-
公开(公告)号:CN113408668B
公开(公告)日:2024-10-25
申请号:CN202110875333.9
申请日:2021-07-30
Applicant: 深圳前海微众银行股份有限公司
IPC: G06F18/243 , G06F18/2431 , G06F18/214 , G06N20/20
Abstract: 本申请提供一种基于联邦学习系统的决策树构建方法、装置、电子设备、存储介质及计算机程序产品,包括:获取训练样本和待构建的决策树的类型,并基于训练样本及类型,确定用于构建决策树的分裂点的参考数据;对参考数据进行压缩处理得到第一压缩数据,并将第一压缩数据发送至第二参与方设备;接收第二参与方设备发送的分裂点数据,分裂点数据为,第二参与方设备基于第一压缩数据,进行对应决策树的分裂点构建所得到;基于分裂点数据,确定决策树的全局分裂点,并基于全局分裂点,构建决策树。如此,减少了决策树构建过程中的数据传输量与处理量,降低了传输开销,提升了决策树的构建效率。
-
公开(公告)号:CN112416912B
公开(公告)日:2024-05-07
申请号:CN202011099097.8
申请日:2020-10-14
Applicant: 深圳前海微众银行股份有限公司
IPC: G06F16/215 , G06F16/28 , G06F17/16 , G06F21/60 , G06N20/00
Abstract: 本发明公开了一种纵向联邦数据统计的去重方法、装置、终端设备及存储介质,通过纵向联邦中的任意一个参与方接收纵向联邦中的其他参与方发送的结果矩阵,其中,结果矩阵为其他参与方在本地基于自有数据中的第一待去重数据构建第一特征矩阵后,利用第一特征矩阵乘以预设随机矩阵得到;在本地基于自有数据中的第二待去重数据构建第二特征矩阵,并将第二特征矩阵与结果矩阵进行纵向拼接得到拼接矩阵;检测拼接矩阵中对应位置元素相同的各目标行,并针对各所述目标行指向的所述第一待去重数据和所述第二待去重数据进行去重处理。本发明无需针对待去重数据进行加密操作就能在确保数据隐私安全的情况下进行数据去重,提高了数据去重的效率。
-
-
-
-
-
-
-
-
-