保护数据隐私的模型训练、预测方法及其系统

    公开(公告)号:CN111125760B

    公开(公告)日:2022-02-15

    申请号:CN201911334587.9

    申请日:2019-12-20

    Inventor: 周俊

    Abstract: 本说明书中的实施例提供了保护数据隐私的模型训练、预测方法及其系统,其技术要点包括:训练的模型包括包含输入层的第一部分和包含输出层的第二部分,所述方法包括:对于任一训练样本,获取所述训练样本的特征值,所述第一部分基于所述特征值得到的模型中间值,所述第二部分基于所述模型中间值得到的输出结果,以及特征值还原装置基于所述模型中间值得到的所述特征值的还原值;调节所述模型的参数和/或结构,以增大训练样本的特征值的还原值与特征值本身的第一差异以及减小第二部分的输出结果和样本标签的第二差异。

    资源预测方法和装置
    42.
    发明公开

    公开(公告)号:CN113485833A

    公开(公告)日:2021-10-08

    申请号:CN202110780138.8

    申请日:2021-07-09

    Inventor: 李龙飞 周俊

    Abstract: 本公开披露了一种资源预测方法和装置。所述方法包括:接收集群的待处理任务;从预设的多种资源预测方式中选择与所述待处理任务对应的资源预测方式;根据所述待处理任务对应的资源预测方式,对所述待处理任务所需的目标资源进行预测;其中,所述多种资源预测方式包括第一资源预测方式和第二资源预测方式,所述第一资源预测方式基于预先训练的机器学习模型对所述目标资源进行预测,所述第二资源预测方式基于所述集群在滑动窗口期内的任务的资源使用数据对所述目标资源进行预测。

    调度机器学习任务的方法及装置

    公开(公告)号:CN113419837A

    公开(公告)日:2021-09-21

    申请号:CN202110782059.0

    申请日:2021-07-09

    Inventor: 李龙飞 周俊

    Abstract: 本公开披露了一种调度机器学习任务的方法和装置。所述方法包括:接收用户向集群提交的机器学习任务,所述集群配置有能够执行所述机器学习任务的多种机器学习模型;根据所述多种机器学习模型的模型统计信息,从所述多种机器学习模型中选择目标机器学习模型;将所述机器学习任务调度至所述集群的目标工作节点,并指示所述目标工作节点采用所述目标机器学习模型处理所述机器学习任务。

    训练迁移学习模型和推荐模型的方法及装置

    公开(公告)号:CN113222073A

    公开(公告)日:2021-08-06

    申请号:CN202110650697.7

    申请日:2021-06-09

    Abstract: 本公开披露了一种训练迁移学习模型和推荐模型的方法和装置。所述方法包括:对源域样本和目标域样本进行聚类,得到聚类结果;根据所述聚类结果确定所述源域样本的权值,所述源域样本的权值用于表征所述源域样本与所述目标域样本的相似度;根据所述源域样本的权值从所述源域样本中确定所述目标域样本的相似样本,以形成包含所述相似样本和所述目标域样本的训练样本;根据所述训练样本训练所述迁移学习模型。

    一种对象聚类方法和系统
    45.
    发明授权

    公开(公告)号:CN112529115B

    公开(公告)日:2021-05-18

    申请号:CN202110159392.6

    申请日:2021-02-05

    Inventor: 李龙飞 周俊

    Abstract: 本说明书涉及一种对象聚类方法和系统,在该方法包括基于多个对象及对象间的关联关系构造图数据;其中,所述图数据包括多个节点以及节点间的边权信息;对图神经网络模型进行一轮或多轮迭代更新,并将最后一轮迭代更新获得的图数据的节点类簇作为节点聚类结果,进而基于节点聚类结果确定对象聚类结果,其中一轮迭代更新包括:利用图神经网络模型处理图数据,得到各节点的嵌入向量,以及基于各节点的嵌入向量确定的节点间的边权预测信息;利用聚类算法处理各节点的嵌入向量,得到一个或多个类簇;确定每个类簇的中心点的嵌入向量,并计算各节点与其所在类簇的中心点的距离;调整所述图神经网络模型的模型参数。

    训练用于表征知识图谱的图神经网络模型的方法及装置

    公开(公告)号:CN110866190B

    公开(公告)日:2021-05-14

    申请号:CN201911127100.X

    申请日:2019-11-18

    Abstract: 本说明书实施例提供一种训练用于表征知识图谱的图神经网络模型的方法和装置,其中方法包括,从知识图谱中获取三元组,其中包括第一节点,第二节点,以及从第一节点指向第二节点的第一连接边;然后,在边嵌入层,根据第一连接边对应的关系类型以及边属性特征,确定对应的第一边向量;在节点嵌入层,分别将第一节点和第二节点作为目标节点,根据目标节点的节点属性特征,以及目标节点的邻居节点集,进行多级向量嵌入,从而分别得到与第一节点和第二节点对应的第一高阶向量和第二高阶向量。接着,根据第一高阶向量、第二高阶向量和第一边向量,确定第一节点通过第一连接边连接到第二节点的概率,以最大化概率为目标,更新边嵌入层和节点嵌入层。

    基于多方安全计算的机器学习模型训练及预测方法、装置

    公开(公告)号:CN111061963B

    公开(公告)日:2021-05-11

    申请号:CN201911194334.6

    申请日:2019-11-28

    Inventor: 陈超超 王力 周俊

    Abstract: 本说明书实施例提供基于多方安全计算的非线性机器学习模型训练方法、模型预测方法及装置。非线性机器学习模型被分解为多个子模型,每个子模型部署在对应训练参与方处。在每次循环时,将非线性机器学习模型的模型计算分割为至少一个第一模型计算和至少一个第二模型计算。针对各个第一模型计算,经由各个训练参与方使用对应模型参数以及训练样本数据或者在前第二模型计算的计算结果来进行多方安全计算。针对各个第二模型计算,使用在前第一模型计算的计算结果来在可信计算设备的可信执行环境中进行可信计算。在循环未结束时,根据预测差值调整各个训练参与方的子模型。利用该方法,能够在确保隐私数据安全的情况下提高模型训练效率。

    叶节点分类权值的确定方法、装置、及设备

    公开(公告)号:CN112765652A

    公开(公告)日:2021-05-07

    申请号:CN202110013267.4

    申请日:2020-07-31

    Inventor: 方文静 王力 周俊

    Abstract: 本说明书提出一种叶节点分类权值的确定方法、装置、及设备,包括:将本方持有的目标对象的特征输入本方的部分树模型,预测得到与所述目标对象匹配的若干第一疑似叶节点;根据所述若干第一疑似叶节点和对方预测得到的若干第二疑似叶节点,确定为所述目标对象预测得到的目标叶节点;基于本方确定出的所述目标叶节点的本方权值分片的密文、以及对方发送的该目标叶节点的对方权值分片的密文,确定目标叶节点对应的分类权值;其中,所述本方权值分片的密文由本方采用本方公钥对该目标叶节点的本方权值分片进行同态加密得到;根据所述目标叶节点和所述分类权值确定所述目标对象的分类结果。

    基于数据隐私保护的机器学习模型特征筛选方法及装置

    公开(公告)号:CN111062487B

    公开(公告)日:2021-04-20

    申请号:CN201911195304.7

    申请日:2019-11-28

    Inventor: 陈超超 王力 周俊

    Abstract: 本说明书实施例提供用于基于数据隐私保护的机器学习模型特征筛选的方法。机器学习模型具有模型特征集,并且机器学习模型的特征数据被垂直切分地分布在第一数据拥有方和至少一个第二数据拥有方处,每个数据拥有方具有与模型特征集的模型特征子集对应的特征数据。第一数据拥有方具有待筛选模型特征的特征数据,第二数据拥有方不具有待筛选模型特征的特征数据。第一数据拥有方和至少一个第二数据拥有方协同来使用各自的特征数据进行多方安全计算,以训练出待筛选模型特征的预测模型。在第一数据拥有方处,基于待筛选模型特征的预测差值确定待筛选模型特征的方差膨胀因子,以进行模型特征筛选处理。

Patent Agency Ranking