-
公开(公告)号:CN113657617B
公开(公告)日:2024-08-13
申请号:CN202111077337.9
申请日:2020-04-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/20
Abstract: 本说明书实施例公开了一种模型联合训练的方法及系统。所述方法包括:多个联合训练的参与终端分别基于所述终端自身持有的私有数据联合进行模型训练,多个联合训练的参与终端分别使用基于梯度的优化算法生成各自的梯度;所述多个参与终端分别将所述各自的梯度发送给服务器;所述服务器从多个所述梯度中选取可信任梯度,并且根据选取的所述可信任梯度更新所述联合训练模型的参数;所述样本数据为文本数据、语音数据或者图形数据。
-
公开(公告)号:CN111461904B
公开(公告)日:2022-06-21
申请号:CN202010304997.5
申请日:2020-04-17
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书一个或多个实施例公开了对象类别的分析方法及装置,用于解决现有技术中对象类别的分析准确度较低的问题。所述方法包括:获取属于目标类别的第一对象对应的第一文本,及,获取第二对象对应的第二文本。利用预先训练的序列到序列模型及词向量集,确定所述第一文本对应的第一文本向量及所述第二文本对应的第二文本向量,所述序列到序列模型为根据具有相关性标签信息的多个样本文本训练得到,各所述样本文本包含多个有序的样本词语。基于所述第一文本向量及所述第二文本向量,确定所述第一文本及所述第二文本之间的相关性信息。根据所述第一文本及所述第二文本之间的相关性信息,确定所述第二对象是否属于所述目标类别。
-
公开(公告)号:CN111178458B
公开(公告)日:2020-08-14
申请号:CN202010276683.9
申请日:2020-04-10
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 曹绍升
IPC: G06K9/62
Abstract: 本说明书实施例提供一种分类模型的训练、对象分类方法及装置,在训练方法中,获取带分类标签的样本。在嵌入层中,确定样本的特征向量以及分类标签的标签向量。在卷积层中,基于若干不同宽度的卷积窗口,对样本的特征向量进行多次卷积处理,得到多个卷积结果。在池化层中,计算各卷积结果与分类标签的标签向量之间的相似度,并基于计算得到的相似度,确定对应于各卷积结果的注意力权重值。基于对应于各卷积结果的注意力权重值,对各卷积结果进行加权平均池化操作,得到池化结果。将池化结果作为样本的样本表示向量,并至少基于样本表示向量以及分类标签的标签向量,确定预测损失。基于预测损失,调整分类模型的参数。
-
公开(公告)号:CN111507543A
公开(公告)日:2020-08-07
申请号:CN202010466497.1
申请日:2020-05-28
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种用于预测实体间业务关系的模型训练方法及装置,利用采集到的实体基础数据构建基础关系图谱,从而利用实体间已知的上下游业务关系,训练包含第一图神经网络和第一分类网络的业务关系预测模型,用于挖掘未知的上下游业务关系。进一步地,本说明书实施例还提供一种实体业务关系图谱的构建方法及装置,通过利用训练后的业务关系预测模型,挖掘出未知的上下游业务关系,进而结合已知的实体间业务关系,构建实体业务关系图谱。更进一步地,本说明书实施例还提供一种实体业务风险的预测方法及装置,基于构建出的实体业务关系图谱,实现对实体节点进行精准地业务风险预测。
-
公开(公告)号:CN111428487A
公开(公告)日:2020-07-17
申请号:CN202010125311.6
申请日:2020-02-27
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/284 , G06F40/289
Abstract: 本说明书实施例提供了一种模型训练方法、歌词生成方法、装置、电子设备及介质,该模型训练方法通过样本歌曲的歌词文本得到的样本分词序列,先根据样本分词序列中每个词语出现的频率,对样本分词序列中的词语进行剔除处理,然后基于样本分词序列以及样本分词序列中每个分词的词向量,对长短期记忆网络模型进行训练,得到歌词生成模型,用于自动生成新的歌词文本。
-
公开(公告)号:CN111221960A
公开(公告)日:2020-06-02
申请号:CN201911030483.9
申请日:2019-10-28
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 曹绍升
IPC: G06F16/35 , G06F40/289 , G06F40/30
Abstract: 本说明书实施例提供一种文本检测方法、相似度计算方法、模型训练方法、装置及设备。获取第二文本以及待检测的第一文本,生成所述第一文本以及所述第二文本中各词语的向量集合,所述向量集合包括所述词语的词向量以及n-元笔画向量,将所述第一文本中各词语、所述第二文本中各词语以及所述向量集合输入到预先训练的文本相似度计算模型,以计算所述第一文本和第二文本的相似度,基于所述相似度以及所述第二文本的类别确定所述第一文本是否为目标类别的文本。基于文本各词语的n元笔画向量计算文本相似度,可以从更粒度地提取词语之间的关联,也解决了预测中出现新词语的问题,可以有效检测测出目标类别的文本。
-
公开(公告)号:CN113689006B
公开(公告)日:2024-06-11
申请号:CN202111074304.9
申请日:2020-04-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/20
Abstract: 本说明书实施例公开了一种模型联合训练的方法及系统。所述方法包括:多个联合训练的参与终端分别基于所述终端自身持有的私有数据联合进行模型训练,多个联合训练的参与终端分别使用基于梯度的优化算法生成各自的梯度;所述多个参与终端分别将所述各自的梯度发送给服务器;所述服务器从多个所述梯度中选取可信任梯度,并且根据选取的所述可信任梯度更新所述联合训练模型的参数;所述样本数据为文本数据、语音数据或者图形数据。
-
公开(公告)号:CN111401038B
公开(公告)日:2023-10-27
申请号:CN202010121213.5
申请日:2020-02-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/216 , G06F40/289 , G06F40/247 , G06F16/33
Abstract: 本说明书实施例公开了一种文本处理方法、装置、电子设备及存储介质,能够基于歌词文本进行语句对提取处理得到K组歌词改写词对,进而根据K组歌词改写词对生成相应的K个改写词对候选集,每个改写词对候选集中包含针对同一源词的一个以上歌词改写词对,以及针对同一源词的一个以上歌词改写词对中每个歌词改写词对的改写概率。
-
公开(公告)号:CN111046299B
公开(公告)日:2023-07-18
申请号:CN201911288471.6
申请日:2019-12-11
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9536 , G06Q30/0601 , G06Q50/00
Abstract: 本说明书实施例提供了一种针对关系网络的特征信息提取方法及装置。关系网络表征多个实体对象之间的关联关系,节点代表实体对象,利用关系网络包括的N个节点以及节点之间的连接边可以对应得到N*N维邻接矩阵;对邻接矩阵进行降维,使得得到的映射矩阵的行数或者列数为预设的节点向量维数D,且节点向量维数D小于N;对映射矩阵进行正交化处理,使得得到的正交化矩阵进一步提取邻接矩阵中的重要信息,再对正交化矩阵进行特征值分解,利用特征值分解结果确定邻接矩阵对应的节点向量矩阵,确定的节点向量矩阵中的节点向量可以表征实体对象的特征信息。其中,关系网络包含个人数据。
-
公开(公告)号:CN111026973B
公开(公告)日:2023-04-18
申请号:CN201911375799.1
申请日:2019-12-27
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F16/9536 , G06Q10/04
Abstract: 本发明提供一种商品兴趣度预测方法、装置及电子设备;所述方法包括:获取用户关系网络图;所述用户关系网络图包括:表示用户的用户节点,以及连接所述用户节点以表示用户间存在好友关系的边;其中,部分所述用户节点关联有用于表示商品兴趣度的标签;将所述用户关系网络图输入图注意力网络模型,得到连接有所述边的两个所述用户节点间的影响度;根据所述影响度和所述用户关系网络图,生成加权用户关系网络图;根据所述加权用户关系网络图,使用预定的预测算法,得到商品兴趣度预测结果。
-
-
-
-
-
-
-
-
-