-
公开(公告)号:CN114510944A
公开(公告)日:2022-05-17
申请号:CN202210153195.8
申请日:2022-02-18
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/295 , G06F40/30 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本说明书一个或多个实施例提供一种名称匹配方法、训练方法、设备及存储介质。所述方法包括:获取待匹配名称的名称字符串;根据预先训练好的神经网络将所述待匹配名称的名称字符串转换成表征向量;其中,所述神经网络用于将同一名称的不同变体的字符串均转换成同一表征向量;确定所述待匹配名称的表征向量分别与预存的若干参考名称的表征向量之间的相似度;其中,所述参考名称的表征向量为将所述参考名称的任一变体的字符串输入所述神经网络得到;根据所述相似度确定所述待匹配名称与所述参考名称是否匹配。本实施例有利于提高匹配效率和匹配准确性。
-
公开(公告)号:CN114118108A
公开(公告)日:2022-03-01
申请号:CN202111330368.0
申请日:2021-11-11
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/58 , G06F40/274 , G06F40/126 , G06N3/04 , G06N3/08
Abstract: 本说明书实施例提供了一种建立转译模型的方法、转译方法和对应装置,根据本说明书实施例,首先获取包含多个训练样本的训练数据;然后利用训练数据训练包含编码器、文本解码器和语音解码器的辅助模型;其中,将训练样本的源语言文本作为编码器的输入,由编码器输出该源语言文本的特征表示;文本解码器利用特征表示预测该源语言文本的目标语言文本;语音解码器利用特征表示预测该源语言文本的语音索引文本;辅助模型的训练目标为:最小化文本解码器的预测结果与训练样本中对应目标语言文本的差异以及最小化语音解码器的预测结果与训练样本中对应语音索引文本的差异;再利用训练得到的辅助模型中的编码器和文本解码器得到转译模型。
-
公开(公告)号:CN113191777A
公开(公告)日:2021-07-30
申请号:CN202110520349.8
申请日:2021-05-13
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q20/40 , G06F40/279 , G06N3/04 , G06N3/08
Abstract: 本说明书实施例提供了一种风险识别方法和装置。该方法首先获取用户在当前交易中输入的文本信息;利用所述文本信息进行第一风险识别,确定是否存在风险;如果否,则获取所述用户在M次历史交易中产生的M次交易行为信息;M为大于1的正整数;利用所述M次交易行为信息,生成用户行为序列;利用所述用户行为序列进行第二风险识别,确定是否存在风险。
-
公开(公告)号:CN112990383A
公开(公告)日:2021-06-18
申请号:CN202110510166.8
申请日:2021-05-11
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06K9/62
Abstract: 本说明书实施例提供了一种对抗样本的生成方法和装置。该方法中,首先获取原始样本;根据所述原始样本,得到至少两个原始向量;从所述至少两个原始向量中选择出待扰动向量;对待扰动向量添加对抗扰动,得到扰动向量;在预先设置的向量池中检索与扰动向量相近似的向量;其中,所述向量池中包括根据各历史原始样本得到的各历史原始向量;根据检索到的相近似的向量,得到对抗样本。
-
公开(公告)号:CN115422929A
公开(公告)日:2022-12-02
申请号:CN202211088506.3
申请日:2022-09-07
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/289 , G06F40/216 , G06N3/04 , G06N3/08
Abstract: 本公开提出了一种文本纠错方法和系统。该方法包括:接收待纠错文本;使用多种分词方法将待纠错文本切分成多种粒度的子词序列;对每种粒度的子词序列进行纠错以获得每种粒度的候选纠错文本;融合各种粒度的候选纠错文本以确定目标纠错文本;以及输出所确定的目标纠错文本。
-
公开(公告)号:CN115147849A
公开(公告)日:2022-10-04
申请号:CN202210686424.2
申请日:2022-06-17
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/19 , G06V10/774 , G06V10/82
Abstract: 本说明书实施例描述了字符编码模型的训练方法、字符匹配方法和装置。根据实施例的方法,首先获取样本训练集,然后针对各个样本训练集进行编码处理。进一步,利用各个样本训练集得到的表征向量可以计算损失函数值。最后,利用得到的损失函数值即可训练字符编码模型。由于训练模型的每一个样本训练集中包含有标准字符串、正样本字符串和负样本字符串,而且正样本字符串和标准字符串表征的对象相同,负样本字符串和标准字符串表征的对象不同。如此在利用得到的模型对字符串进行编码时,能够使表征同一对象的字符串的表征向量相似度更高,而使表征不同对象的字符串的表征向量相似度更低,从而在进行字符串匹配时能够提高字符串匹配的准确性。
-
-
-
-
-