-
公开(公告)号:CN111652622B
公开(公告)日:2023-08-01
申请号:CN202010454581.1
申请日:2020-05-26
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书公开了一种风险网址的识别方法,装置及电子设备,该方法包括:获取待识别的目标网址;爬取所述目标网址对应的文本信息和图像信息;通过多模态表示学习获取所述文本信息与所述图像信息之间的共同表征;通过机器学习算法对所述共同表征进行分类,确认所述目标网址是否为风险网址。在上述技术方案中,通过获取目标网址对应的文本信息和图像信息进行多模态表示学习获得两者之间的共同表征,排除无效信息和干扰信息,基于其共同表征进行风险网址识别,提升了风险网址识别的准确率。
-
公开(公告)号:CN110990857B
公开(公告)日:2021-04-06
申请号:CN201911269227.5
申请日:2019-12-11
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了保护隐私安全的多方联合进行特征评估的方法和装置。该多方至少包括存储有第一样本集的第一设备和存储有第二样本集的第二设备,该方法应用于第一设备;该方法包括:对第一样本集中各样本的初始ID进行加密,并将得到的第一样本集的第一次加密ID和标签发送给第二设备;从第二设备接收第二样本集的第一次加密ID和所在分箱的标识,以及第一样本集的第二次加密ID和标签;对第二样本集的第一次加密ID进行加密,得到第二样本集的第二次加密ID;根据第二样本集的第二次加密ID和第一样本集的第二加密ID确定共有样本;根据共有样本的标签、所在分箱的标识计算特征的信息价值,以针对机器学习模型进行特征选择。
-
公开(公告)号:CN110728375B
公开(公告)日:2021-03-19
申请号:CN201910982730.9
申请日:2019-10-16
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00
Abstract: 本说明书实施例提供一种多个计算单元联合训练逻辑回归模型的方法和装置,其中主计算单元中存储样本的第一部分特征和样本标签,从计算单元存储样本的第二部分特征。在联合训练的迭代过程中,针对采样的任意样本,主计算单元和从计算单元各自根据本地存储的该样本的特征部分和模型参数部分,得到部分处理值。主计算单元汇总各个部分处理值后,根据总处理值,该样本的标签值,以及之前采样该样本时存储的梯度值,采用方差约减方式得到不泄露标签值的中间值,并将其发送给从计算单元。于是,各个计算单元可以根据该中间值更新模型参数,进行后续迭代。
-
公开(公告)号:CN111538794A
公开(公告)日:2020-08-14
申请号:CN202010334175.1
申请日:2020-04-24
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种数据融合方法、装置及设备。方案包括:获取第一数据集中的第一实体数据的第一基础数据;获取第二数据集中的第二实体数据的第二基础数据;基于所述第一基础数据和所述第二基础数据判断所述第一实体与所述第二实体是否为同一行为实体,得到判断结果;当所述判断结果表示所述第一实体与所述第二实体为同一行为实体时,将所述第一实体数据和所述第二实体数据合并为第三实体数据,所述第三实体数据用于描述所述行为实体,所述第三实体数据中包含的基础数据的信息大于所述第一实体数据,且大于所述第二实体数据。
-
公开(公告)号:CN111291282A
公开(公告)日:2020-06-16
申请号:CN202010390982.5
申请日:2020-05-09
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9537 , G06Q20/14 , G06Q20/32 , G06Q50/26
Abstract: 本说明书提供一种推荐乘车补登站点的方法及装置和电子设备。所述方法包括:在当前乘车渠道响应于用户的进站请求发现该用户需要补登上一次出站站点时,查询当前乘车渠道内存储的该用户上一次乘车记录的用户乘车数据;基于多方安全排序算法,按照时间顺序对存储在其它乘车渠道内该用户上一次乘车记录的用户乘车数据和当前乘车渠道内的用户乘车数据进行排序;其中,多方安全排序算法用于在其它乘车渠道不发送存储的用户乘车数据的情况下,确定当前乘车渠道和其它乘车渠道的用户乘车数据之间的排序结果;根据排序结果中每个用户乘车数据对应的站点名称,向用户推荐补登站点。由于多方安全排序过程中用户乘车数据不出域,从而保护了用户的隐私。
-
公开(公告)号:CN111160572A
公开(公告)日:2020-05-15
申请号:CN202010251416.6
申请日:2020-04-01
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00
Abstract: 本说明书实施例提供一种基于多标签的联邦学习方法、装置和系统,该方法包括:多个机构在进行联邦学习时,可信执行环境可以获取由多个机构提供的多个标签数据组,任一标签数据组中包括多个用户的原始标签,所述多个用户中至少存在一个用户在所述多个标签数据组中的多个原始标签不一致;在获取到多个标签数据组后,利用预设的弱监督学习算法对所述多个标签数据组进行学习训练,得到统一的目标标签数据组,目标标签数据组中包括所述多个用户的目标标签;将所述目标标签数据组发送给所述多个机构,以便由所述多个机构基于所述目标标签数据组进行联邦学习。
-
公开(公告)号:CN111062044A
公开(公告)日:2020-04-24
申请号:CN201911252312.0
申请日:2019-12-09
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种基于区块链的模型联合训练方法及装置,在训练方法中,区块链的当前层节点接收对应的上层节点发送的第一训练结果。该第一训练结果至少基于第一类型结果确定,第一类型结果由上层节点基于其在链下维护的私有数据,对其在链上维护的多种模型中的目标模型进行训练后得到。当前层节点基于其链下维护的私有数据,对其在链上维护的多种模型中的目标模型进行训练,得到第二训练结果。对第一训练结果和第二训练结果进行融合,得到融合结果。判断当前层节点是否在最后一个层级。若当前层节点在最后一个层级,则在区块链上广播所述融合结果,以使得多个节点基于融合结果对各自在链上维护的多种模型中的目标模型进行更新。
-
公开(公告)号:CN110855641A
公开(公告)日:2020-02-28
申请号:CN201911043415.6
申请日:2019-10-30
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本发明公开了一种社区属性信息确定方法,该方法包括:获取至少一个账户之间的关系数据;在从至少一个账户中确定出至少一个社区后,根据至少一个账户之间的关系数据确定至少一个社区的属性信息;其中,属性信息包括社区节点相关信息和/或社区结构相关信息;以及输出至少一个社区及其属性信息。本发明还公开了社区属性信息确定装置、计算设备以及计算机可读存储介质。
-
公开(公告)号:CN111538794B
公开(公告)日:2023-10-03
申请号:CN202010334175.1
申请日:2020-04-24
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种数据融合方法、装置及设备。方案包括:获取第一数据集中的第一实体数据的第一基础数据;获取第二数据集中的第二实体数据的第二基础数据;基于所述第一基础数据和所述第二基础数据判断所述第一实体与所述第二实体是否为同一行为实体,得到判断结果;当所述判断结果表示所述第一实体与所述第二实体为同一行为实体时,将所述第一实体数据和所述第二实体数据合并为第三实体数据,所述第三实体数据用于描述所述行为实体,所述第三实体数据中包含的基础数据的信息大于所述第一实体数据,且大于所述第二实体数据。
-
公开(公告)号:CN111738440B
公开(公告)日:2020-11-24
申请号:CN202010757517.0
申请日:2020-07-31
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 公开了一种基于领域自适应与联邦学习的模型训练方法及系统。一方面,采用联邦学习架构,使得源业务方与目标业务方可以在不彼此交互数据隐私的情况下联合训练模型,保护了双方的数据隐私。另一方面,针对目标业务领域的样本集缺乏准确标签的情况,利用源业务领域的样本集的特征与标签之间的映射关系进行迁移学习,本质上是将源业务领域下训练的模型适应到目标业务领域下。
-
-
-
-
-
-
-
-
-