-
公开(公告)号:CN111652622B
公开(公告)日:2023-08-01
申请号:CN202010454581.1
申请日:2020-05-26
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书公开了一种风险网址的识别方法,装置及电子设备,该方法包括:获取待识别的目标网址;爬取所述目标网址对应的文本信息和图像信息;通过多模态表示学习获取所述文本信息与所述图像信息之间的共同表征;通过机器学习算法对所述共同表征进行分类,确认所述目标网址是否为风险网址。在上述技术方案中,通过获取目标网址对应的文本信息和图像信息进行多模态表示学习获得两者之间的共同表征,排除无效信息和干扰信息,基于其共同表征进行风险网址识别,提升了风险网址识别的准确率。
-
公开(公告)号:CN112200380B
公开(公告)日:2023-07-25
申请号:CN202011147798.4
申请日:2020-10-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q10/04 , G06Q10/0635 , G06Q10/067 , G06N20/00
Abstract: 本说明书实施例提供一种优化风险检测模型的方法和装置,该方法包括,首先获取样本集,其中包括具有第一标签值的正常样本和具有第二标签值的原始风险样本。对于各个原始风险样本,根据训练风险检测模型使用的损失函数以及当前的风险检测模型,确定攻击者对该原始风险样本进行潜在攻击变换而得到的对抗风险样本。然后基于损失函数,确定风险检测模型针对各个对抗风险样本的第一预测损失,以及针对各个正常样本的第二预测损失;并至少基于该第一和第二预测损失,确定总预测损失。接着,以总预测损失最小化为目标,调整风险检测模型的模型参数,以优化该风险检测模型。
-
公开(公告)号:CN115859975B
公开(公告)日:2023-05-09
申请号:CN202310104834.6
申请日:2023-02-07
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/289 , G10L15/02 , G10L15/26
Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,其中,该方法包括:获取目标数据对应的第一分词结果,所述目标数据为人机交互过程中生成的数据;基于所述第一分词结果中每个分词包括的多个字符,确定所述每个分词对应的信息值,所述分词对应的信息值用于表征所述每个分词包括的多个字符之间的关联强度;基于所述每个分词对应的信息值和所述分词之间的音标关联关系,对所述第一分词结果进行修正处理,得到第二分词结果;基于所述第二分词结果,对所述目标数据进行风险检测处理。
-
公开(公告)号:CN115994252A
公开(公告)日:2023-04-21
申请号:CN202310099699.0
申请日:2023-01-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/906 , G06F18/22 , G06F18/214 , G06F18/241 , G06N20/00
Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,其中,该方法包括:获取新增标签、所述新增标签对应的第二样本、第一标签以及与所述第一标签对应的第一样本,并基于所述第二样本和所述第一样本,确定所述新增标签与所述第一标签之间的相似度;获取所述第一标签对应的第一权重;基于所述相似度和所述第一标签对应的第一权重,确定所述新增标签对应的第二权重,并基于所述第一权重和所述第二权重,对所述训练后的标签预测模型中全连接层的权重进行更新,得到待训练的标签预测模型;对所述待训练的标签预测模型进行训练,得到更新后的标签预测模型。
-
公开(公告)号:CN115983862A
公开(公告)日:2023-04-18
申请号:CN202211706274.3
申请日:2022-12-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q20/40 , G06N3/0464 , G06N3/08
Abstract: 本说明书实施例公开了一种模型的处理方法、装置及设备,该方法包括:获取应用于可信场景中的风险防控模型的资源损失目标函数和群体可信分数约束函数;基于所述资源损失目标函数和相应的第一权重,以及所述群体可信分数约束函数和相应的第二权重,构建相应的优化函数;基于构建的优化函数、所述资源损失目标函数和所述群体可信分数约束函数,确定所述资源损失目标函数和所述群体可信分数约束函数对应的优化目标信息;基于确定的优化目标信息,并通过训练样本对应用于可信场景中的风险防控模型进行模型训练,得到训练后的风险防控模型。
-
公开(公告)号:CN115546810B
公开(公告)日:2023-04-11
申请号:CN202211507954.2
申请日:2022-11-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/412 , G06V30/414
Abstract: 本说明书实施例提供一种图像元素类别的识别方法及装置,在识别方法中,从多模态的目标图像中,提取其中包含的多个文本片段,及其对应的多个边界框。针对多个边界框形成的初始集合,迭代执行若干轮次的切分操作,其中单论切分操作根据边界框的轴向投影,将本轮当前集合划分为多个子集合,并确定各个子集合的相对排序,直至得到各个边界框的排序编号,该排序编号指示各个边界框的阅读顺序。至少将多个文本片段、多个边界框及其各自的排序编号,输入类别预测模型进行识别处理,得到目标图像中包含的各个元素的类别。
-
公开(公告)号:CN113255908B
公开(公告)日:2023-04-07
申请号:CN202110584259.5
申请日:2021-05-27
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/044 , G06N3/045 , G06N3/048 , G06N3/08 , G06N3/0442 , G06N3/0455
Abstract: 本说明书实施例提供一种基于事件序列进行业务预测的方法和神经网络模型。在该方法中,首先获取目标事件序列,其中包含τ个事件;事件的类别型字段的备选类别值被视为实体。然后确定单个事件对应的事件嵌入向量;τ个事件的事件嵌入向量构成嵌入矩阵。接着,利用分配矩阵对嵌入矩阵进行线性变换,基于线性变换结果得到实体表征矩阵;其中,分配矩阵指示各事件对各实体的包含关系。进一步的,对实体表征矩阵中对应于同一字段的矩阵部分进行池化操作,得到该字段对应的字段表征向量;再基于各字段表征向量,确定目标事件序列对应的条件嵌入向量。从而至少基于该条件嵌入向量,确定目标事件序列对应的序列表征向量,用于进行与事件相关的业务预测。
-
公开(公告)号:CN115545002B
公开(公告)日:2023-03-31
申请号:CN202211509841.6
申请日:2022-11-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/194 , G06F40/289 , G06F40/30
Abstract: 本说明书公开了一种模型训练和业务处理的方法、装置、存储介质及设备。该模型训练的方法包括,获取历史对话,从历史对话中确定目标语句,将历史对话输入待训练的特征提取模型中,以使特征提取模型根据历史对话中除目标语句外的其他语句,确定目标语句对应的语句特征,作为第一特征,以及,根据目标语句,确定目标语句对应的语句特征,作为第二特征,以最小化第一特征与第二特征之间的偏差为优化目标,对特征提取模型进行训练,其中,训练后的特征提取模型用于确定输入的每个对话语句对应的语句特征,并将输出的语句特征进行发送,以使接收端根据接收到的语句特征进行业务处理。
-
公开(公告)号:CN115599891B
公开(公告)日:2023-03-21
申请号:CN202211508333.6
申请日:2022-11-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/33 , G06F16/332 , G06F40/30 , G06F18/23 , G06N20/00
Abstract: 本说明书公开了一种确定异常对话数据方法、装置、设备及可读存储介质,基于历史对话数据以及预先训练的第一语义识别模型,训练第二语义识别模型,当接收到携带待检测对话数据的检测请求时,将待检测对话数据分别输入到第一语义识别模型以及第二语义识别模型中,通过确定待检测对话数据的第一语义与第二语义之间的差异,确定该待检测对话数据是否为异常数据,以便第一用户对异常数据进行处理。可见,即使面对海量的待检测对话数据,也可以实现自动从各待检测对话数据中筛选出异常数据,节约人力的同时,还能够提高异常数据识别的效率,从而提高智能对话系统的可靠性,以及增强对隐私信息的安全性。
-
公开(公告)号:CN115545720B
公开(公告)日:2023-03-10
申请号:CN202211508334.0
申请日:2022-11-29
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书公开了一种模型训练的方法、业务风控的方法及装置,首先,获取用户的操作信息。其次,根据操作信息,确定在服务端上所产生的业务事件。而后,将操作信息输入到待训练的第一特征提取模型中,确定操作信息对应的操作特征,以及,将业务事件对应的事件信息输入到预设的第二特征提取模型中,确定业务事件对应的业务事件特征。最后,以最小化操作特征与业务事件特征之间的偏差为优化目标,对第一特征提取模型进行训练,第一特征提取模型用于从操作信息中提取操作特征,并将提取出的操作特征输入到风控模型,以使风控模型根据第一特征提取模型提取出的操作特征,进行业务风控。本方法可以降低服务器上的计算资源的消耗,提高业务风控的效率。
-
-
-
-
-
-
-
-
-