-
公开(公告)号:CN112990383B
公开(公告)日:2025-05-23
申请号:CN202110510166.8
申请日:2021-05-11
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/214
Abstract: 本说明书实施例提供了一种对抗样本的生成方法和装置。该方法中,首先获取原始样本;根据所述原始样本,得到至少两个原始向量;从所述至少两个原始向量中选择出待扰动向量;对待扰动向量添加对抗扰动,得到扰动向量;在预先设置的向量池中检索与扰动向量相近似的向量;其中,所述向量池中包括根据各历史原始样本得到的各历史原始向量;根据检索到的相近似的向量,得到对抗样本。
-
公开(公告)号:CN114819976B
公开(公告)日:2025-02-28
申请号:CN202210466962.0
申请日:2022-04-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q20/40
Abstract: 本说明书实施例提供了针对交易的制裁扫描方法及装置。该方法涉及扫描引擎,扫描引擎关联多个审理机器人,该多个审理机器人包括第一审理机器人,该方法包括:扫描引擎将其生成的当前审理任务发送至第一审理机器人,当前审理任务根据针对当笔交易的制裁扫描请求生成;第一审理机器人在本地数据库中查找与当前审理任务相同的目标人工审理任务,其中,该本地数据库存储有若干人工审理任务和该若干人工审理任务分别对应的审理结果;若查找到,则将目标人工审理任务对应的审理结果返回给扫描引擎;若未查找到,则向扫描引擎返回无法决策消息。
-
公开(公告)号:CN113989043B
公开(公告)日:2024-07-12
申请号:CN202111264179.8
申请日:2021-10-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q40/04 , G06Q20/40 , G06N3/0442 , G06N3/08
Abstract: 本说明书实施例公开了一种事件的风险识别方法、装置及设备,该方法包括:获取与当前发生的目标事件相关的历史事件的信息,并确定所述历史事件中不同事件之间的关联特征,确定所述目标事件对应的嵌入特征;基于所述目标事件和所述历史事件的文本数据,确定所述文本数据的序列变化信息;基于所述历史事件中不同事件之间的关联特征、所述目标事件对应的嵌入特征和所述文本数据的序列变化信息,确定所述目标事件的风险识别结果。
-
公开(公告)号:CN113961704B
公开(公告)日:2024-06-14
申请号:CN202111266143.3
申请日:2021-10-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35 , G06N3/045 , G06N3/0475 , G06N3/084 , G06N3/094
Abstract: 本说明书实施例公开了一种基于文本的风险防控处理方法、装置及设备,该方法包括:获取针对目标业务的历史文本数据,然后,将历史文本数据输入到预先构建的生成器中,生成与历史文本数据对应的对抗文本数据,该对抗文本数据与历史文本数据之间的相似度高于预设相似度阈值,将历史文本数据和相应的对抗文本数据构建的数据对输入到预先构建的判别器中,通过该判别器分别对历史文本数据和相应的对抗文本数据进行评分,并通过对比历史文本数据的评分值和相应的对抗文本数据的评分值,以及预设的损失函数对生成器和判别器进行训练,得到训练后的生成器和判别器,最终,通过训练后的判别器对目标业务进行基于文本数据的风险防控处理。
-
公开(公告)号:CN111581950B
公开(公告)日:2024-01-02
申请号:CN202010361585.5
申请日:2020-04-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/247 , G06F40/30 , G06F16/33 , G06F16/36 , G06Q10/0635 , G06Q40/04
Abstract: 为准确、全面地挖掘出目标对象的同义名称词。本说明书提供了同义名称词的确定方法和同义名称词的知识库的建立方法。在一个实施例中,同义名称词的确定方法通过先获取包含有目标对象的第一名称词的第一语料数据,以及与第一语料数据关联的第二语料数据;再通过根据预设的处理规则对上述语料数据进行基于自然语言理解的多组预设处理,得到处理后的语料数据;进而可以利用上述处理后的语料数据,通过确定并利用文本数据的正则表达式,以及文本数
-
公开(公告)号:CN116229484A
公开(公告)日:2023-06-06
申请号:CN202310125818.5
申请日:2023-01-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/246 , G06V30/42 , G06F16/31 , G06F16/33
Abstract: 本说明书实施例提供了一种文字识别方法及装置、名单扫描方法及装置。在该方法中包括:确定待识别文字;根据预先设定的笔顺编码规则以及所述待识别文字的书写笔顺,得到待识别文字对应的笔顺编码;从该笔顺编码中拆分出至少一个编码片段;针对每一个编码片段均执行:根据预先设置的容差限制,在预先生成的字典中收集与当前的编码片段相对应的一组候选已知文字;其中,所述字典中包括多个已知文字;在对应各个编码片段的各组候选已知文字之间求交集,根据该交集得到所述待识别文字所对应的所述字典中的目标已知文字。本说明书实施例能够更为有效地识别出输入的文字。
-
公开(公告)号:CN115422929A
公开(公告)日:2022-12-02
申请号:CN202211088506.3
申请日:2022-09-07
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/289 , G06F40/216 , G06N3/04 , G06N3/08
Abstract: 本公开提出了一种文本纠错方法和系统。该方法包括:接收待纠错文本;使用多种分词方法将待纠错文本切分成多种粒度的子词序列;对每种粒度的子词序列进行纠错以获得每种粒度的候选纠错文本;融合各种粒度的候选纠错文本以确定目标纠错文本;以及输出所确定的目标纠错文本。
-
公开(公告)号:CN115147849A
公开(公告)日:2022-10-04
申请号:CN202210686424.2
申请日:2022-06-17
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/19 , G06V10/774 , G06V10/82
Abstract: 本说明书实施例描述了字符编码模型的训练方法、字符匹配方法和装置。根据实施例的方法,首先获取样本训练集,然后针对各个样本训练集进行编码处理。进一步,利用各个样本训练集得到的表征向量可以计算损失函数值。最后,利用得到的损失函数值即可训练字符编码模型。由于训练模型的每一个样本训练集中包含有标准字符串、正样本字符串和负样本字符串,而且正样本字符串和标准字符串表征的对象相同,负样本字符串和标准字符串表征的对象不同。如此在利用得到的模型对字符串进行编码时,能够使表征同一对象的字符串的表征向量相似度更高,而使表征不同对象的字符串的表征向量相似度更低,从而在进行字符串匹配时能够提高字符串匹配的准确性。
-
公开(公告)号:CN113961704A
公开(公告)日:2022-01-21
申请号:CN202111266143.3
申请日:2021-10-28
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种基于文本的风险防控处理方法、装置及设备,该方法包括:获取针对目标业务的历史文本数据,然后,将历史文本数据输入到预先构建的生成器中,生成与历史文本数据对应的对抗文本数据,该对抗文本数据与历史文本数据之间的相似度高于预设相似度阈值,将历史文本数据和相应的对抗文本数据构建的数据对输入到预先构建的判别器中,通过该判别器分别对历史文本数据和相应的对抗文本数据进行评分,并通过对比历史文本数据的评分值和相应的对抗文本数据的评分值,以及预设的损失函数对生成器和判别器进行训练,得到训练后的生成器和判别器,最终,通过训练后的判别器对目标业务进行基于文本数据的风险防控处理。
-
公开(公告)号:CN112528653A
公开(公告)日:2021-03-19
申请号:CN202011398845.2
申请日:2020-12-02
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/289
Abstract: 本公开提供了一种短文本实体识别方法,包括:获取短文本并对该短文本进行分词;对经分词的短文本进行词向量训练,以生成词向量序列;基于对抗性框架对该词向量序列中的各个词向量进行词性表征学习,以获取该词向量的词性特征;提取该词向量序列中的各个词向量的局部上下文特征以及各个词向量之间的全局语义特征;以及使用词性特征、局部上下文特征和全局语义特征识别实体。
-
-
-
-
-
-
-
-
-