-
公开(公告)号:CN115618748B
公开(公告)日:2023-05-02
申请号:CN202211508332.1
申请日:2022-11-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F30/27 , G06F16/248 , G06F16/2455 , G06F30/20 , G06Q40/04
Abstract: 本说明书公开了一种模型优化的方法、装置、设备及存储介质,可以对从各业务模型中,筛选出业务结果准确率低的模型作为目标模型,从而可以根据目标模型的输入的特征数据,以及目标模型的输出结果进行拟合,从而可以确定出输入到目标模型中的特征数据的每个特征维度对应的权重值,进而可以根据确定出的特征数据的每个特征维度对应的权重值,确定出目标模型对特征数据中的哪些特征维度的数据更为关注,并根据目标模型关注的特征维度,对目标模型进行优化。
-
公开(公告)号:CN110738562B
公开(公告)日:2023-04-25
申请号:CN201910981823.X
申请日:2019-10-16
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q40/03 , G06F40/284 , G06F40/289 , H04W4/14
Abstract: 本申请公开一种风险提醒信息的生成方法、装置以及设备,所述方法包括:获取投诉数据,并将所述投诉数据确定出数据类别;在所述投诉数据中筛选出第一关键词,并将所述第一关键词与所述数据类别输入至预先建立的风险提醒信息生成模型中,生成对应于所述数据类别的风险提醒信息,其中,所述风险提醒信息生成模型用于生成所述数据类别的风险提醒信息。本发明通过获取投诉数据,并将该投诉数据划分出数据类别,进而生成对应于所述数据类别的风险提醒信息,解决了现有技术中的风险提醒信息存在提醒效果不好的问题,减少对用户造成的损失。
-
公开(公告)号:CN115545124B
公开(公告)日:2023-04-18
申请号:CN202211507937.9
申请日:2022-11-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/214 , G06N3/08
Abstract: 本说明书实施例提供了一种样本不平衡场景下的样本增量、模型训练方法及装置。其中,用户样本集包括高风险用户样本和低风险用户样本及其类别标签,高风险用户样本属于小样本。在该方法中,从用户样本集中按照不偏向高风险用户样本的方式确定观测用户样本,从用户样本集中按照偏向高风险用户样本的方式对样本抽样,得到抽样用户样本;基于风控场景中高风险用户数量小于低风险用户数量的风险用户特点,确定第一数量占比,以第一数量占比为平均值确定符合风险用户特点的第一概率分布,按照第一概率分布确定属于观测用户样本的第一因子。这样,基于第一因子、观测用户样本与抽样用户样本及其相应的样本标签,确定插值用户样本以及对应的插值标签。
-
公开(公告)号:CN115964669A
公开(公告)日:2023-04-14
申请号:CN202211611448.8
申请日:2022-12-13
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/2433 , G06F18/2413 , G06F18/2415 , G06F18/22
Abstract: 本说明书公开了一种异常检测方法、装置、可读存储介质及电子设备,通过针对每个大类,将该大类对应的历史行为数据输入异常检测模型中,得到该异常检测模型输出的该异常大类的每个异常子类的表征特征。在获取到待检测的用户行为数据后,将用户行为数据输入该异常检测模型中,根据用户行为数据对应的用户特征和预存的各异常大类包含的各异常子类的表征特征之间的相似度,确定该用户特征所对应的异常大类,并将该异常大类作为用户行为数据的异常检测结果。本方法可仅基于各异常大类分别对应的各异常子类和用户特征之间的相似度来确定异常检测结果,避免了对计算资源过大要求的同时,还能保证异常检测的准确性。
-
公开(公告)号:CN115883053A
公开(公告)日:2023-03-31
申请号:CN202211369556.9
申请日:2022-11-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: H04L9/00 , H04L9/40 , G06F18/214
Abstract: 本说明书实施例提供了基于联邦机器学习的模型训练方法和装置。至少两个客户端以及至少一个云服务器参与基于联邦机器学习的模型训练,在每一轮训练中,第一客户端接收云服务器下发的全局模型;第一客户端利用本地的私有数据训练出该全局模型的梯度;第一客户端对本轮训练得到的梯度进行加密,然后将加密后的梯度发送给云服务器;第一客户端执行下一轮训练,直至全局模型收敛。本说明书实施例能够提高模型训练的安全性。
-
公开(公告)号:CN114692724B
公开(公告)日:2023-03-28
申请号:CN202210208136.6
申请日:2022-03-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/2415 , G06F18/214 , G06N3/047 , G06N3/08
Abstract: 本说明书实施例描述了数据分类模型的训练方法、数据分类方法和装置。根据实施例的方法,首先获取标签已知的正数据样本和标签未知的灰度数据样本,然后分别确定基于该正数据样本的标准正数据概率分布和基于该灰度数据样本的拟合正数据概率分布。进一步即可根据该标准正数据概率分布和拟合正数据概率分布实现对数据分类模型的训练。如此基于灰度数据中的正数据也应服从标准正数据概率分布的原则,构建适用于对所有数据进行标签分类的数据分类模型,从而能够提高利用该数据分类模型对数据进行分类的准确性。
-
公开(公告)号:CN115828171A
公开(公告)日:2023-03-21
申请号:CN202310142321.4
申请日:2023-02-13
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/2415 , G06F21/62
Abstract: 本说明书公开了一种端云协同执行业务的方法、装置、介质及设备,响应于用户操作,确定业务请求,并根据业务请求获取用户数据,确定用户数据中的敏感数据以及非敏感数据。对敏感数据进行特征提取,确定第一特征,将非敏感数据发送到服务器,使服务器对非敏感数据进行特征提取,确定第二特征,接收服务器返回的第二特征。将第一特征与第二特征输入输出层,确定输出结果。对输出结果进行加噪,确定业务请求的加噪输出结果,并将加噪输出结果发送给服务器,使服务器根据加噪输出结果执行业务。使得即使攻击者获取到业务模型以及输出结果,也不能反推出各输出结果对应的用户数据,实现了对用户隐私数据的保护。
-
公开(公告)号:CN115759122A
公开(公告)日:2023-03-07
申请号:CN202211370268.5
申请日:2022-11-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/35
Abstract: 本说明书公开了一种意图识别方法、装置、设备及可读存储介质,通过将待识别信息与预设的各关键词进行匹配,得到所述待识别信息匹配的目标关键词,根据所述目标关键词,从所述目标用户的历史对话记录中,查找与所述目标关键词对应的参考输出信息,以及目标用户针对参考输出信息输入的参考回复信息,进而将待识别信息和参考回复信息输入预训练的意图识别模型,得到模型输出的意图作为待识别信息的目标意图。可见,根据待识别信息匹配的目标关键词,查找参考输出信息和参考回复信息的方式,不需要对现有的意图识别模型的训练方式和模型结构做出调整,也可以结合多轮对话进行意图识别,提高了意图识别的准确性以及隐私信息的安全性。
-
公开(公告)号:CN115599891A
公开(公告)日:2023-01-13
申请号:CN202211508333.6
申请日:2022-11-29
Applicant: 支付宝(杭州)信息技术有限公司(CN)
IPC: G06F16/33 , G06F16/332 , G06F40/30 , G06F18/23 , G06N20/00
Abstract: 本说明书公开了一种确定异常对话数据方法、装置、设备及可读存储介质,基于历史对话数据以及预先训练的第一语义识别模型,训练第二语义识别模型,当接收到携带待检测对话数据的检测请求时,将待检测对话数据分别输入到第一语义识别模型以及第二语义识别模型中,通过确定待检测对话数据的第一语义与第二语义之间的差异,确定该待检测对话数据是否为异常数据,以便第一用户对异常数据进行处理。可见,即使面对海量的待检测对话数据,也可以实现自动从各待检测对话数据中筛选出异常数据,节约人力的同时,还能够提高异常数据识别的效率,从而提高智能对话系统的可靠性,以及增强对隐私信息的安全性。
-
公开(公告)号:CN115546810A
公开(公告)日:2022-12-30
申请号:CN202211507954.2
申请日:2022-11-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/412 , G06V30/414
Abstract: 本说明书实施例提供一种图像元素类别的识别方法及装置,在识别方法中,从多模态的目标图像中,提取其中包含的多个文本片段,及其对应的多个边界框。针对多个边界框形成的初始集合,迭代执行若干轮次的切分操作,其中单论切分操作根据边界框的轴向投影,将本轮当前集合划分为多个子集合,并确定各个子集合的相对排序,直至得到各个边界框的排序编号,该排序编号指示各个边界框的阅读顺序。至少将多个文本片段、多个边界框及其各自的排序编号,输入类别预测模型进行识别处理,得到目标图像中包含的各个元素的类别。
-
-
-
-
-
-
-
-
-