-
公开(公告)号:CN111581950B
公开(公告)日:2024-01-02
申请号:CN202010361585.5
申请日:2020-04-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/247 , G06F40/30 , G06F16/33 , G06F16/36 , G06Q10/0635 , G06Q40/04
Abstract: 为准确、全面地挖掘出目标对象的同义名称词。本说明书提供了同义名称词的确定方法和同义名称词的知识库的建立方法。在一个实施例中,同义名称词的确定方法通过先获取包含有目标对象的第一名称词的第一语料数据,以及与第一语料数据关联的第二语料数据;再通过根据预设的处理规则对上述语料数据进行基于自然语言理解的多组预设处理,得到处理后的语料数据;进而可以利用上述处理后的语料数据,通过确定并利用文本数据的正则表达式,以及文本数
-
公开(公告)号:CN117171706A
公开(公告)日:2023-12-05
申请号:CN202311214004.5
申请日:2023-09-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/25 , G06F40/30 , G06V30/16 , G06Q10/0635
Abstract: 本说明书公开了一种业务风控方法、装置、存储介质及电子设备,可以通过特征提取模型的第一编码层提取出待风控对象的业务数据的语义、字音、字形等模态上的特征,并可以将提取出的待风控对象的各模态特征进行融合,得到融合后的特征,从而可以基于融合后的特征进行业务风控,进而可以避免风险用户对自身的用户信息进行语义、字音、字形上的部分修改后无法被有效识别的情况发生。
-
公开(公告)号:CN111310456B
公开(公告)日:2023-06-20
申请号:CN202010090933.X
申请日:2020-02-13
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/284 , G06F40/295 , G06F40/30 , G06N3/048 , G06N3/0455 , G06N3/0464 , G06N3/0442 , G06N3/09 , G06N20/00 , G06Q40/04
Abstract: 本说明书实施例提供一种实体名称匹配方法、装置及设备。方案包括:获取待匹配实体名称;对待匹配实体名称进行分词,并将分词映射为向量,得到待匹配实体名称的词向量;采用基于自注意力机制的特征抽取器对每个词向量进行特征抽取,得到第一特征向量;再采用训练完成的条件随机场模型对第一特征向量进行序列标注,得到携带有域标签的第二特征向量,将第二特征向量输入到实体匹配模型中,得到匹配结果。
-
公开(公告)号:CN116229484A
公开(公告)日:2023-06-06
申请号:CN202310125818.5
申请日:2023-01-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/246 , G06V30/42 , G06F16/31 , G06F16/33
Abstract: 本说明书实施例提供了一种文字识别方法及装置、名单扫描方法及装置。在该方法中包括:确定待识别文字;根据预先设定的笔顺编码规则以及所述待识别文字的书写笔顺,得到待识别文字对应的笔顺编码;从该笔顺编码中拆分出至少一个编码片段;针对每一个编码片段均执行:根据预先设置的容差限制,在预先生成的字典中收集与当前的编码片段相对应的一组候选已知文字;其中,所述字典中包括多个已知文字;在对应各个编码片段的各组候选已知文字之间求交集,根据该交集得到所述待识别文字所对应的所述字典中的目标已知文字。本说明书实施例能够更为有效地识别出输入的文字。
-
公开(公告)号:CN115422929A
公开(公告)日:2022-12-02
申请号:CN202211088506.3
申请日:2022-09-07
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/289 , G06F40/216 , G06N3/04 , G06N3/08
Abstract: 本公开提出了一种文本纠错方法和系统。该方法包括:接收待纠错文本;使用多种分词方法将待纠错文本切分成多种粒度的子词序列;对每种粒度的子词序列进行纠错以获得每种粒度的候选纠错文本;融合各种粒度的候选纠错文本以确定目标纠错文本;以及输出所确定的目标纠错文本。
-
公开(公告)号:CN115147849A
公开(公告)日:2022-10-04
申请号:CN202210686424.2
申请日:2022-06-17
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/19 , G06V10/774 , G06V10/82
Abstract: 本说明书实施例描述了字符编码模型的训练方法、字符匹配方法和装置。根据实施例的方法,首先获取样本训练集,然后针对各个样本训练集进行编码处理。进一步,利用各个样本训练集得到的表征向量可以计算损失函数值。最后,利用得到的损失函数值即可训练字符编码模型。由于训练模型的每一个样本训练集中包含有标准字符串、正样本字符串和负样本字符串,而且正样本字符串和标准字符串表征的对象相同,负样本字符串和标准字符串表征的对象不同。如此在利用得到的模型对字符串进行编码时,能够使表征同一对象的字符串的表征向量相似度更高,而使表征不同对象的字符串的表征向量相似度更低,从而在进行字符串匹配时能够提高字符串匹配的准确性。
-
公开(公告)号:CN113961704A
公开(公告)日:2022-01-21
申请号:CN202111266143.3
申请日:2021-10-28
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种基于文本的风险防控处理方法、装置及设备,该方法包括:获取针对目标业务的历史文本数据,然后,将历史文本数据输入到预先构建的生成器中,生成与历史文本数据对应的对抗文本数据,该对抗文本数据与历史文本数据之间的相似度高于预设相似度阈值,将历史文本数据和相应的对抗文本数据构建的数据对输入到预先构建的判别器中,通过该判别器分别对历史文本数据和相应的对抗文本数据进行评分,并通过对比历史文本数据的评分值和相应的对抗文本数据的评分值,以及预设的损失函数对生成器和判别器进行训练,得到训练后的生成器和判别器,最终,通过训练后的判别器对目标业务进行基于文本数据的风险防控处理。
-
公开(公告)号:CN112528653A
公开(公告)日:2021-03-19
申请号:CN202011398845.2
申请日:2020-12-02
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/289
Abstract: 本公开提供了一种短文本实体识别方法,包括:获取短文本并对该短文本进行分词;对经分词的短文本进行词向量训练,以生成词向量序列;基于对抗性框架对该词向量序列中的各个词向量进行词性表征学习,以获取该词向量的词性特征;提取该词向量序列中的各个词向量的局部上下文特征以及各个词向量之间的全局语义特征;以及使用词性特征、局部上下文特征和全局语义特征识别实体。
-
公开(公告)号:CN111711618A
公开(公告)日:2020-09-25
申请号:CN202010489800.X
申请日:2020-06-02
Applicant: 支付宝(杭州)信息技术有限公司
IPC: H04L29/06
Abstract: 本申请公开了一种风险地址识别方法、设备和装置,该方法包括:获取待识别地址数据;将所述待识别地址数据通过第一预设模型划分为多个字符组;确定划分后的每个字符组对应的词嵌入向量;将每个字符组对应的词嵌入向量输入风险地址识别网络模型,得到所述待识别地址数据是否为风险地址。
-
公开(公告)号:CN111476508A
公开(公告)日:2020-07-31
申请号:CN202010410307.4
申请日:2020-05-15
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种目标操作的风险识别方法,所述方法可以包括:获取所述目标操作的信息;所述目标操作的信息至少包括与所述目标操作相关的至少一个目标实体;以及基于风险识别引擎对所述至少一个目标实体进行匹配识别,并根据匹配识别结果判断所述目标操作的风险。所述风险识别引擎可以包括实体关系网络和判断单元,所述实体关系网络可以包括预设实体以及与所述预设实体存在预设关联关系的关联实体;所述判断单元可以用于基于所述实体关系网络判断所述目标操作的风险。
-
-
-
-
-
-
-
-
-