-
公开(公告)号:CN110751275B
公开(公告)日:2022-09-02
申请号:CN201911013968.7
申请日:2019-10-23
Applicant: 北京达佳互联信息技术有限公司
IPC: G06N3/06
Abstract: 本公开关于一种图训练系统、数据访问方法及装置、电子设备、存储介质。一种图训练系统,包括参数服务器,所述参数服务器内设置有持久性内存,所述持久性内存被配置为保证所述参数服务器在非对称场景下读数据和写数据的数据访问;其中,所述图训练系统的参数以及嵌入,分布式地存储在所述参数服务器中。因此,通过在大规模图神经网络训练系统中使用可持久性内存,带来极大的性能改善,为改善大规模机器学习模型训练系统的性能开辟了新的方向。并且,该图训练系统以及持久性内存也可以应用于推荐系统以满足大规模推荐场景的需求,提高推荐系统的数据吞吐量,并可以降低存储成本。同时,使得故障重启时间大大减少,极大提高了系统可用性。
-
公开(公告)号:CN110633796B
公开(公告)日:2022-04-08
申请号:CN201910837927.3
申请日:2019-09-05
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开是关于一种模型更新方法、装置、电子设备及存储介质,涉及计算机技术领域,用以解决相关技术中在模型训练完毕后,将模型生成镜像推送到预估服务器,模型更新速度较慢的问题,本公开方法包括:在执行服务器使用同一个历史样本集合进行模型参数的迭代训练过程中,根据每次接收到的所述执行服务器发送的梯度值对模型参数进行更新;在满足参数推送条件后,将上次满足参数推送条件之后进行更新的模型参数中的部分或全部模型参数推送给预估服务器。由于本公开实施例在迭代训练过程中通过多次推送将更新的模型参数增量推送给预估服务器,由于每次推送预估服务器的模型参数是有限的,减小了预估服务器的压力。
-
公开(公告)号:CN111881317B
公开(公告)日:2021-08-20
申请号:CN202010757251.X
申请日:2020-07-31
Applicant: 北京达佳互联信息技术有限公司
Inventor: 任恺
Abstract: 本公开是关于基于键值系统的数据存储方法、装置、电子设备及介质,其中,用于存储键值对数据的持久化索引空间划分为多个存储块,每个存储块用于存储键值对数据的索引信息,所述索引信息中包括键数据和值数据的内存地址,该方法包括:获取待存储索引信息;对所述待存储索引信息的键数据进行取模处理后,确定所述待存储索引信息对应的存储块;当所述存储块的存储空间不足时,根据预先建立的键数据与候选存储块的对应关系,确定所述待存储索引信息的候选存储块;将所述待存储索引信息存储到所述候选存储块中。根据本公开提供的数据存储方法,解决了相关技术中存在的无论扩容和缩容都需要维护两张目录表的缺点。
-
公开(公告)号:CN111898740B
公开(公告)日:2021-07-20
申请号:CN202010761179.8
申请日:2020-07-31
Applicant: 北京达佳互联信息技术有限公司
Inventor: 任恺
Abstract: 本公开关于一种预测模型的模型参数更新方法及装置。该方法接收工作服务器对获取的模型参数执行模型参数迭代训练时发送的包括模型参数的当前梯度的参数更新请求,且检测出模型参数的类型为嵌入参数后,通过采用满足第一参数更新算法和当前梯度,对嵌入参数进行更新,第一参数更新算法为所需的内存需求量小于预设需求量的算法。该方法通过采用第一参数更新算法可以降低嵌入参数更新的内存使用量,解决了嵌入参数在模型训练期间的内存使用量不足的问题。
-
公开(公告)号:CN112269943A
公开(公告)日:2021-01-26
申请号:CN202011394631.8
申请日:2020-12-03
Applicant: 北京达佳互联信息技术有限公司
Inventor: 任恺
IPC: G06F16/9535 , G06F16/735
Abstract: 本公开关于一种信息推荐系统及方法,属于推荐技术领域,用于提高推荐信息的准确性,该系统包括第一推荐单元和第二推荐单元;第一推荐单元包括第一特征处理器和推荐数据处理器,第一特征处理器用于根据账户的第一账户关联信息得到第一输入特征,并将第一输入特征传递至推荐数据处理器;推荐数据处理器用于根据第一输入特征和第二推荐单元得到的放缩特征信息确定待推荐对象的推荐参数;第二推荐单元包括第二特征处理器和门控单元,第二特征处理器用于根据第二账户关联信息得到第二输入特征,并将第二输入特征传递至门控单元;门控单元用于根据第二输入特征得到放缩特征信息,并将放缩特征信息传递至推荐数据处理器。
-
公开(公告)号:CN111898740A
公开(公告)日:2020-11-06
申请号:CN202010761179.8
申请日:2020-07-31
Applicant: 北京达佳互联信息技术有限公司
Inventor: 任恺
Abstract: 本公开关于一种预测模型的模型参数更新方法及装置。该方法接收工作服务器对获取的模型参数执行模型参数迭代训练时发送的包括模型参数的当前梯度的参数更新请求,且检测出模型参数的类型为嵌入参数后,通过采用满足第一参数更新算法和当前梯度,对嵌入参数进行更新,第一参数更新算法为所需的内存需求量小于预设需求量的算法。该方法通过采用第一参数更新算法可以降低嵌入参数更新的内存使用量,解决了嵌入参数在模型训练期间的内存使用量不足的问题。
-
公开(公告)号:CN111881358A
公开(公告)日:2020-11-03
申请号:CN202010761056.4
申请日:2020-07-31
Applicant: 北京达佳互联信息技术有限公司
Inventor: 任恺
IPC: G06F16/9535 , G06N5/04
Abstract: 本公开关于一种对象推荐系统、方法、装置、电子设备和存储介质,属于互联网技术领域,该系统中,多个存储设备,用于存储各账户的稀疏特征和各账户的稀疏特征对应的嵌入参数,其中,每个账户的稀疏特征是根据该账户的操作行为数据生成的,嵌入参数是预测模型预先学习到的;推理服务器,用于在确定满足向任一目标账户推荐对象的条件时,从目标账户对应的存储设备获取目标账户的稀疏特征,根据预设的嵌入参数的存储方式,确定稀疏特征对应的存储设备,从确定的存储设备读取稀疏特征对应的嵌入参数,进而利用各稀疏特征对应的嵌入参数和存储的预测模型的网络参数,确定目标账户的推荐对象,其中,网络参数是预测模型学习到的除嵌入参数之外的参数。
-
公开(公告)号:CN110751275A
公开(公告)日:2020-02-04
申请号:CN201911013968.7
申请日:2019-10-23
Applicant: 北京达佳互联信息技术有限公司
IPC: G06N3/06
Abstract: 本公开关于一种图训练系统、数据访问方法及装置、电子设备、存储介质。一种图训练系统,包括参数服务器,所述参数服务器内设置有持久性内存,所述持久性内存被配置为保证所述参数服务器在非对称场景下读数据和写数据的数据访问;其中,所述图训练系统的参数以及嵌入,分布式地存储在所述参数服务器中。因此,通过在大规模图神经网络训练系统中使用可持久性内存,带来极大的性能改善,为改善大规模机器学习模型训练系统的性能开辟了新的方向。并且,该图训练系统以及持久性内存也可以应用于推荐系统以满足大规模推荐场景的需求,提高推荐系统的数据吞吐量,并可以降低存储成本。同时,使得故障重启时间大大减少,极大提高了系统可用性。
-
公开(公告)号:CN110633052A
公开(公告)日:2019-12-31
申请号:CN201910838750.9
申请日:2019-09-05
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F3/06
Abstract: 本申请公开了一种存储嵌入参数的方法及装置,实现合理分配存储空间的效果,该方法包括:获取待存储的嵌入参数,基于所述待存储的嵌入参数所属的嵌入组的组号,结合所述待存储的嵌入参数在所述嵌入组中的序号,确定所述待存储的嵌入参数的存储位置;在预设的共享存储空间中,基于所述存储位置以及所述待存储的嵌入参数的数据量大小,确定存在足够的存储空间时,基于所述存储位置,将所述待存储的嵌入参数存储于所述共享存储空间中。这样,能够快速确定待存储的嵌入参数的存储位置,充分利用存储空间,同时,有效避免存储嵌入参数时发生冲突,从而合理、高效的分配存储空间。
-
公开(公告)号:CN119127442A
公开(公告)日:2024-12-13
申请号:CN202411269746.2
申请日:2024-09-10
Applicant: 北京达佳互联信息技术有限公司 , 清华大学
IPC: G06F9/48 , G06F16/9535 , G06F18/20 , G06F18/10
Abstract: 本公开提供了一种资源推荐方法、服务器及存储介质,属于计算机技术领域。上述方法包括:响应于资源推荐请求,通过CPU,基于资源推荐请求携带的对象数据确定标识信息;通过CPU,向DPU发送标识信息;通过DPU,基于标识信息确定第一特征信息,并对第一特征信息进行预处理,第一特征信息包括标识信息中的每个数据标识关联的特征;基于预处理后的第一特征信息,预测多个候选资源的推荐参数,推荐参数用于从多个候选资源中确定推荐资源。上述技术方案能够将特征的确定过程和预处理过程从CPU迁移到DPU上,降低了CPU的计算负载,提高了资源推荐的效率。
-
-
-
-
-
-
-
-
-