-
公开(公告)号:CN110826324B
公开(公告)日:2024-02-09
申请号:CN201911047639.4
申请日:2019-10-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/289 , G06F40/126 , G06N3/045 , G06N3/0464 , G06N3/0442 , G06N3/08
Abstract: 本说明书实施例提供一种语言模型的训练及分词预测方法和装置、语言模型,采用分词及其笔画集合来训练语言模型以及预测目标分词,由于提取出分词级以及笔画级的特征,特征粒度更小,因此,训练出的语言模型准确度较高,预测目标分词的准确性也越高。
-
公开(公告)号:CN111538906B
公开(公告)日:2023-06-20
申请号:CN202010477510.3
申请日:2020-05-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F21/62 , G06F40/30 , G06N3/0464
Abstract: 本说明书实施例提供一种基于隐私保护的信息推送方法和装置,可以用于在保护用户隐私数据的前提下,基于历史会话中的对象选择序列建立异构图,并根据异构图体现出的推送对象之间的深层关联关系,从多个候选推送对象中确定若干个目标对象进行信息推送。根据一个实施方式,可以获取当前会话中的对象选择序列,并添加目标项构成预测序列,接着,将预测序列中的各项基于异构图确定描述向量,再根据各个描述向量推测目标项的预测向量,之后根据预测向量和各个候选推送对象的描述向量的对比,为目标项确定多个目标对象。该实施方式可以提高信息推送的准确度。
-
公开(公告)号:CN111428487B
公开(公告)日:2023-04-07
申请号:CN202010125311.6
申请日:2020-02-27
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/284 , G06F40/289
Abstract: 本说明书实施例提供了一种模型训练方法、歌词生成方法、装置、电子设备及介质,该模型训练方法通过样本歌曲的歌词文本得到的样本分词序列,先根据样本分词序列中每个词语出现的频率,对样本分词序列中的词语进行剔除处理,然后基于样本分词序列以及样本分词序列中每个分词的词向量,对长短期记忆网络模型进行训练,得到歌词生成模型,用于自动生成新的歌词文本。
-
公开(公告)号:CN110866543B
公开(公告)日:2022-07-15
申请号:CN201910995352.8
申请日:2019-10-18
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/774 , G06V10/764 , G06V10/82 , G06N3/04 , G06N20/00
Abstract: 本说明书实施例提供一种图片检测及图片分类模型的训练方法和装置,根据由原始训练图片以及伪文本图片共同训练得到的图片分类模型对待检测图片进行检测,以获取包括预设类别的第一文本的目标待检测图片。由于训练图片分类模型时同时采用了原始训练图片以及伪文本图片,增加了训练样本的多样性,产生了更多的文本表达,因此,提高了图片检测的准确度。
-
公开(公告)号:CN111523686B
公开(公告)日:2021-08-03
申请号:CN202010326265.6
申请日:2020-04-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/20
Abstract: 本说明书实施例公开了一种模型联合训练的方法及系统。所述方法包括:多个联合训练的参与终端分别基于所述终端自身持有的私有数据联合进行模型训练,多个联合训练的参与终端分别使用基于梯度的优化算法生成各自的梯度;所述多个参与终端分别将所述各自的梯度发送给服务器;所述服务器从多个所述梯度中选取可信任梯度,并且根据选取的所述可信任梯度更新所述联合训练模型的参数;所述样本数据为文本数据、语音数据或者图形数据。
-
公开(公告)号:CN111814921A
公开(公告)日:2020-10-23
申请号:CN202010922527.5
申请日:2020-09-04
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种对象特征信息获取、对象分类、信息推送方法及装置。在确定对象的特征信息时,从N个时刻的N个关系网络中分别确定第一节点的多个邻居节点,得到N个邻居节点组,并基于每个时刻对应的邻居节点组以及第一节点的节点特征,确定第一节点在各个时刻的空间聚合特征;将N个时刻的N个空间聚合特征按照时间顺序以序列的方式输入序列神经网络,分别得到第一节点在N个时刻的N个时空表达;对N个时空表达进行聚合,得到第一节点的时空聚合特征,作为第一节点代表的第一对象的特征信息。
-
公开(公告)号:CN111461904A
公开(公告)日:2020-07-28
申请号:CN202010304997.5
申请日:2020-04-17
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书一个或多个实施例公开了对象类别的分析方法及装置,用于解决现有技术中对象类别的分析准确度较低的问题。所述方法包括:获取属于目标类别的第一对象对应的第一文本,及,获取第二对象对应的第二文本。利用预先训练的序列到序列模型及词向量集,确定所述第一文本对应的第一文本向量及所述第二文本对应的第二文本向量,所述序列到序列模型为根据具有相关性标签信息的多个样本文本训练得到,各所述样本文本包含多个有序的样本词语。基于所述第一文本向量及所述第二文本向量,确定所述第一文本及所述第二文本之间的相关性信息。根据所述第一文本及所述第二文本之间的相关性信息,确定所述第二对象是否属于所述目标类别。
-
公开(公告)号:CN111291417A
公开(公告)日:2020-06-16
申请号:CN202010384206.4
申请日:2020-05-09
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F21/62 , G06F16/9535
Abstract: 本说明书实施例提供一种保护数据隐私的多方联合训练对象推荐模型的方法,其中多方为N方,共同维护M个用户对P个对象的总评分矩阵。该方法由N方中任意的第k方执行,包括:先通过秘密分享,获取以下矩阵分片:该总评分矩阵的第k评分矩阵分片、初始化的该P个对象的对象特征矩阵的第k对象矩阵分片和初始化的该M个用户的用户特征矩阵的第k用户矩阵分片;再执行多次迭代更新,具体地,基于上述矩阵分片,通过与其他N-1方进行秘密分享矩阵运算,得到对象更新梯度和用户更新梯度的第k分片,进而更新第k对象矩阵分片和第k用户矩阵分片。如此在多次迭代更新结束后,N方各自交换更新后的矩阵分片,进行矩阵重构,进而建立各自的对象推荐模型。
-
公开(公告)号:CN111291165A
公开(公告)日:2020-06-16
申请号:CN202010384236.5
申请日:2020-05-09
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/33 , G06F16/35 , G06F40/289 , G06F40/30
Abstract: 本说明书实施例提供一种训练词向量嵌入模型的方法,该方法包括多次迭代更新,其中任一次包括:先从训练语句对应的词语序列中,确定中心词语和对应的多个上下文词语;接着,根据第一词向量矩阵,确定该中心词语对应的中心词向量,以及根据第二词向量矩阵,确定该多个上下文词语对应的多个上下文词向量;然后,基于该多个上下文词向量彼此之间的相似度,确定其对应的多个注意力权重;再利用该多个注意力权重,对该多个上下文词向量进行加权求和,得到中心词语的上下文表示向量;再然后,计算该中心词向量与该上下文表示向量之间的第一相似度;最后,至少以增大该第一相似度为目标,更新上述第一词向量矩阵和第二词向量矩阵。
-
公开(公告)号:CN111046299A
公开(公告)日:2020-04-21
申请号:CN201911288471.6
申请日:2019-12-11
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9536 , G06Q30/06 , G06Q50/00
Abstract: 本说明书实施例提供了一种针对关系网络的特征信息提取方法及装置。关系网络表征多个实体对象之间的关联关系,节点代表实体对象,利用关系网络包括的N个节点以及节点之间的连接边可以对应得到N*N维邻接矩阵;对邻接矩阵进行降维,使得得到的映射矩阵的行数或者列数为预设的节点向量维数D,且节点向量维数D小于N;对映射矩阵进行正交化处理,使得得到的正交化矩阵进一步提取邻接矩阵中的重要信息,再对正交化矩阵进行特征值分解,利用特征值分解结果确定邻接矩阵对应的节点向量矩阵,确定的节点向量矩阵中的节点向量可以表征实体对象的特征信息。其中,关系网络包含个人数据。
-
-
-
-
-
-
-
-
-