-
公开(公告)号:CN117744837B
公开(公告)日:2024-08-20
申请号:CN202311873819.4
申请日:2023-12-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00 , G06F18/214 , G06F18/22 , G06F18/25 , G06F40/205 , G06F40/30 , G06N3/0455 , G06N3/08
Abstract: 本说明书公开一种模型训练、文本检测方法、装置、存储介质及设备,可以通过对不同的互联网平台上公开文本数据集进行整理,同时,通过使用多种常见对话大语言模型和丰富的提示语集合,来构造用于训练检测模型的训练数据,并且,由于在构建用于训练检测模型的训练数据的过程中,针对训练数据进行了多次过滤,使得得到的训练数据更接近于实际场景中的对大语言模型生成的文本进行使用的场景。除此之外,在对检测模型进行训练的过程中,通过使用具有较大参数规模的教师大语言模型输出的依据文本供检测模型学习,从而可以提升训练后的检测模型针对通过大语言模型生成的文本进行识别的准确率。
-
公开(公告)号:CN113657350B
公开(公告)日:2024-06-14
申请号:CN202111063132.5
申请日:2021-05-12
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V40/16 , G06V10/774 , G06F21/62
Abstract: 本说明书一个或多个实施例公开了一种人脸图像处理方法及装置。所述方法包括:获取多个第一样本人脸图像对,各第一样本人脸图像对中分别包括具有隐私信息的第一样本原始人脸图像、以及对应的具有干扰信息的第一样本目标人脸图像。然后根据各第一样本人脸图像对分别对应的图像匹配信息,确定待训练的图像编码模型对应的损失函数。进而将第一样本原始人脸图像作为输入数据、将第一样本目标人脸图像作为输出数据,并基于损失函数进行模型训练,得到图像编码模型,并利用图像编码模型对人脸图像进行隐私保护处理。
-
公开(公告)号:CN118114042A
公开(公告)日:2024-05-31
申请号:CN202410141534.X
申请日:2024-01-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/214 , G06F18/213 , G06F40/30 , G06N20/00 , G06Q20/40
Abstract: 本说明书公开了一种模型训练的方法、装置、存储介质和电子设备,所述方法包括:针对确定出的每一个样本交易数据,确定该样本交易数据的属性描述为浅层文本,确定该样本交易数据的风险描述为深层文本。将该样本交易数据输入待训练的风险识别模型,得到该样本交易数据的浅特征和深特征。将浅层文本输入文本识别模型,得到第一特征,将深层文本输入文本识别模型,确定第二特征。根据该样本交易数据的第一特征、该样本交易数据的浅特征、该样本交易数据的第二特征以及该样本交易数据的深特征,对待训练的风险识别模型进行训练。通过第一特征以及第二特征,指导风险识别模型对各样本交易数据进行特征提取,更好地表征用户存在的风险,提高准确性。
-
公开(公告)号:CN114092097B
公开(公告)日:2024-05-24
申请号:CN202111396497.X
申请日:2021-11-23
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书一个或多个实施例涉及数据处理技术领域,尤其涉及一种风险识别模型的训练方法、交易风险确定方法及装置。该方法包括:获取训练样本,训练样本包括第一交易的意愿标签、风险标签以及多个特征;将多个特征输入风险识别模型进行预测处理,预测处理包括,在特征处理网络,对多个特征进行特征交叉处理,得到表征向量;在第一识别层,基于对表征向量的第一处理结果,确定第一交易的意愿度;在第二识别层,基于对表征向量的第二处理结果,确定第一交易的风险度;在预测损失减小的方向,更新风险识别模型的参数,其中预测损失包括第一损失和第二损失,第一损失基于意愿度和意愿标签确定,第二损失基于风险度和风险标签确定。
-
公开(公告)号:CN112836218B
公开(公告)日:2024-04-16
申请号:CN202110050426.8
申请日:2020-05-09
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书提供一种风险识别方法及装置和电子设备,应用于终端设备的可信执行环境。所述可信执行环境中存储有历史业务请求和风险规则。该方法包括:响应于业务客户端发起的待发送的业务请求,获取业务请求包含的用户账户和终端标识;查询历史业务请求中同样具有该用户账户和设备标识的历史目标业务请求,并对历史目标业务请求进行统计分析,得到风险指标的数值;判断风险指标的数值是否达到风险规则中设定的阈值;删除所述待发送的业务请求中携带的设备标识,并添加判断结果,由所述业务客户端将所述业务请求发送给业务服务端;以使所述业务服务端基于该判断结果执行该业务请求。由于设备标识不对外发送从而可以保护用户的个人信息。
-
公开(公告)号:CN113672709B
公开(公告)日:2024-03-29
申请号:CN202110886944.3
申请日:2021-08-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F21/31 , G06F40/211 , G06F40/35 , G06F16/27 , G06N3/0442 , G06N3/09
Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,包括:接收针对目标业务的第一数据处理请求,其中,第一数据处理请求中携带有终端设备的地址信息,第一数据处理请求为对用户输入的针对目标业务的待验证信息进行验证的处理请求;向终端设备发送第一提示信息,以使用户基于第一提示信息输入与目标业务对应的待验证信息;接收终端设备发送的待验证信息,采用预先训练的预设验证模型对待验证信息进行验证,并基于验证结果执行目标业务,预先训练的预设验证模型为基于样本验证信息所对应的信息内容权重进行有监督的训练得到的。
-
公开(公告)号:CN117575610A
公开(公告)日:2024-02-20
申请号:CN202311633503.8
申请日:2023-11-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q20/40 , G06F40/216 , G06N3/045 , G06F18/23213
Abstract: 本说明书一个或多个实施例公开了一种批量风险的识别方法及装置,首先获取预设时间段内用于进行批量风险识别的投诉信息,然后对投诉信息进行聚类处理,并根据预设的类聚集程度确定多种批量风险以及每种批量风险对应的投诉信息,最后,当批量风险对应的投诉信息中的文本长度大于或等于预设的文本长度阈值时,将每种批量风险对应的投诉信息进行数据切分处理,得到切分后的数据块,将数据块以及预设的提示信息输入大模型中,通过大模型对每种批量风险对应的投诉信息进行风险分析处理,确定每种批量风险的风险描述信息。
-
公开(公告)号:CN117540791A
公开(公告)日:2024-02-09
申请号:CN202410013557.2
申请日:2024-01-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/094 , G06N3/0464 , G06N3/045 , G06N3/044 , G06N3/0475 , G06N3/084 , G06F18/23213 , G06Q20/40
Abstract: 本说明书实施例涉及一种对抗训练的方法及装置,方法包括:首先,获取基于训练集训练的第一模型,训练集中各训练样本包含结构化的特征数据及标签。然后,基于第一模型针对各个训练样本的总预测损失对特征数据的梯度值,确定目标权重向量。接下来,将目标权重向量施加于各训练样本的特征数据,得到各第一结果向量,并构建检索集。最后,基于训练集和检索集对第二模型进行多轮训练;任意一轮训练包括:使用训练集中部分训练样本训练第二模型;基于对抗训练算法与第二模型,确定部分训练样本对应的对抗样本特征;利用对抗样本特征在检索集中进行检索,从而确定各个对抗样本特征的标签,并构建对抗训练集;使用对抗训练集训练第二模型。
-
公开(公告)号:CN117522717A
公开(公告)日:2024-02-06
申请号:CN202410011262.1
申请日:2024-01-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06T5/50 , G06T5/60 , G06T11/60 , G06V10/44 , G06V10/42 , G06V10/46 , G06V10/50 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/0475 , G06N3/094
Abstract: 本说明书实施例公开了一种图像的合成方法、装置及设备,该方法包括:获取包含目标主体的前景图像和待承载目标主体的背景图像,以及将前景图像合成于背景图像中时背景图像中前景图像所在的区域信息和前景图像的合成控制信息;对前景图像进行特征提取,得到前景图像对应的前景全局特征和前景局部特征,并对背景图像进行特征提取,得到背景图像对应的背景图像特征;将前景全局特征和前景局部特征,以及背景图像特征、区域信息和前景图像的合成控制信息输入到可控生成模型中,以通过前景图像的合成控制信息控制可控生成模型将前景全局特征融合到背景图像特征中,并将前景局部特征融合到背景图像特征中该区域信息对应的图像特征中,得到合成图像。
-
公开(公告)号:CN112417485B
公开(公告)日:2024-02-02
申请号:CN202011380981.9
申请日:2020-11-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F21/60 , G06F18/214 , G06Q40/03
Abstract: 本说明书公开了一种基于可信执行环境的模型训练方法、系统及装置。所述方法包括模型需求方将第一训练样本集发送到模型训练方的可信执行环境中;模型提供方将旧模型和第二训练样本集发送到模型训练方的可信执行环境中;所述旧模型是模型提供方预先基于第二训练样本集训练得到的;模型训练方在可信执行环境中基于所述旧模型构建新模型;所述新模型的输出包括针对输入样本的标签预测值和来源预测值;模型训练方在可信执行环境中,基于预设算法利用第一训练样本集和第二训练样本集训练所述新模型,所述预设算法用于降低所述新模型针对样本标签的损失、并增大所述新模型针对样本来源的损失。
-
-
-
-
-
-
-
-
-