-
公开(公告)号:CN117744837B
公开(公告)日:2024-08-20
申请号:CN202311873819.4
申请日:2023-12-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00 , G06F18/214 , G06F18/22 , G06F18/25 , G06F40/205 , G06F40/30 , G06N3/0455 , G06N3/08
Abstract: 本说明书公开一种模型训练、文本检测方法、装置、存储介质及设备,可以通过对不同的互联网平台上公开文本数据集进行整理,同时,通过使用多种常见对话大语言模型和丰富的提示语集合,来构造用于训练检测模型的训练数据,并且,由于在构建用于训练检测模型的训练数据的过程中,针对训练数据进行了多次过滤,使得得到的训练数据更接近于实际场景中的对大语言模型生成的文本进行使用的场景。除此之外,在对检测模型进行训练的过程中,通过使用具有较大参数规模的教师大语言模型输出的依据文本供检测模型学习,从而可以提升训练后的检测模型针对通过大语言模型生成的文本进行识别的准确率。
-
公开(公告)号:CN117953515A
公开(公告)日:2024-04-30
申请号:CN202410194721.4
申请日:2024-02-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/19 , G06V30/148 , G06V30/18 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本说明书公开了一种模型训练的方法、装置、存储介质和电子设备,图像分割模型包括图像编码器、文本编码器、解码器。先获取样本图像、样本指代文本及标签。再通过文本编码器确定不同尺度的文本特征,并通过图像编码器确定每个尺度的文本特征对应的图像特征。之后,将每个尺度的文本特征与对应尺度的图像特征进行融合。接着,通过解码器及各尺度的融合特征,得到预测分割结果,根据预测分割结果及标签,对图像分割模型进行训练。也就是说,通过获取图像及文本的不同尺度的特征,捕获了更多特征,并且,通过将同尺度的图像特征与文本特征融合,使得不同模态的特征进行信息交互,提高了图像分割模型输出的预测分割结果的准确性。
-
公开(公告)号:CN117851794A
公开(公告)日:2024-04-09
申请号:CN202311848032.2
申请日:2023-12-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/21 , G06F18/214 , G06F21/36 , G06F21/62
Abstract: 本说明书涉及一种风险识别模型的训练方法及系统,训练方法包括获取各训练样本,其中每个训练样本包括应用的图标和应用的名称,训练样本的标签为应用的实际风险结果;获取第一风险识别模型和第二风险识别模型;分别利用第一风险识别模型和第二风险识别模型从各训练样本中选择第一有用样本和第二有用样本;利用第一有用样本对第二风险识别模型进行训练,利用第二有用样本对第一风险识别模型进行训练。本说明的风险识别模型的训练方法及系统,利用包括应用的图标和应用的名称的训练样本对风险识别模型进行训练,从而基于应用的图标和名称得到应用的风险结果,且在训练过程中消除了噪声样本的影响,使得训练好的风险识别模型准确性更高。
-
公开(公告)号:CN117671277A
公开(公告)日:2024-03-08
申请号:CN202311226890.3
申请日:2023-09-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/40 , G06V10/74 , G06V10/774
Abstract: 本说明书公开了一种图特征提取方法、装置、存储介质及电子设备。在本说明书提供的图特征提取方法中,获取目标图;将所述目标图输入预先训练的特征提取模型中,所述特征提取模型至少包括对比子网、输出子网;通过所述对比子网,针对所述特征提取模型中存储的每个隐藏图,确定该隐藏图与所述目标图之间的相似度,其中,所述隐藏图是通过对所述特征提取模型进行训练得到的;通过所述输出子网,根据所述目标图与各隐藏图之间的相似度输出所述目标图的图特征。
-
公开(公告)号:CN117575610A
公开(公告)日:2024-02-20
申请号:CN202311633503.8
申请日:2023-11-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q20/40 , G06F40/216 , G06N3/045 , G06F18/23213
Abstract: 本说明书一个或多个实施例公开了一种批量风险的识别方法及装置,首先获取预设时间段内用于进行批量风险识别的投诉信息,然后对投诉信息进行聚类处理,并根据预设的类聚集程度确定多种批量风险以及每种批量风险对应的投诉信息,最后,当批量风险对应的投诉信息中的文本长度大于或等于预设的文本长度阈值时,将每种批量风险对应的投诉信息进行数据切分处理,得到切分后的数据块,将数据块以及预设的提示信息输入大模型中,通过大模型对每种批量风险对应的投诉信息进行风险分析处理,确定每种批量风险的风险描述信息。
-
公开(公告)号:CN117422783A
公开(公告)日:2024-01-19
申请号:CN202311206816.5
申请日:2023-09-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06T11/00 , G06V10/40 , G06V10/80 , G06V10/74 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/08
Abstract: 本说明书实施例公开了一种图像样本生成模型的训练方法,包括获取至少一张银行卡图像作为原始图像;基于伪造任务,确定所述原始图像中的伪造区域和伪造内容;基于所述伪造区域,确定位置约束条件文本;确定内容约束条件文本,以描述所述伪造内容;确定内容指导文本,以描述所述伪造任务;将所述原始图像输入预训练的扩散模型中进行图像样本生成,并在反向扩散过程中,通过所述位置约束条件文本、所述内容约束条件文本和所述内容指导文本对所述扩散模型进行微调。相应地,本发明公开了图像样本生成方法及装置。
-
公开(公告)号:CN116974916A
公开(公告)日:2023-10-31
申请号:CN202310835466.2
申请日:2023-07-07
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F11/36
Abstract: 本说明书一个或多个实施例公开了一种测试用例的生成方法,首先获取生成控制条件,该生成控制条件用于生成对待测大模型进行风险评测的测试用例的控制条件,且该生成控制条件中至少包括引导并生成能够评测出待测大模型存在风险的测试用例的引导信息;然后将生成控制条件输入到预先训练的对抗大模型中,得到与生成控制条件相匹配的测试用例,其中,对抗大模型是基于预设的预训练大模型、样例控制条件和样例控制条件对应的目标测试样例,通过预设的损失函数进行模型训练得到的模型,预设的损失函数至少包括基于生成的测试用例之间具有的对抗性而构建的第一子损失函数。
-
公开(公告)号:CN116935110A
公开(公告)日:2023-10-24
申请号:CN202310870414.9
申请日:2023-07-14
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/764 , G06N3/04 , G06N3/08
Abstract: 本说明书公开了一种图像处理方法、装置、电子设备及存储介质。方法包括:基于针对目标内容实体的注意力神经网络,生成目标图像对应的初始注意力图,其中,所述初始注意力图中的像素通过目标像素参数下的取值大小反映该像素被所述注意力神经网络进行特征提取的概率。将所述初始注意力图中目标像素参数达到预设取值标准的像素设置为目标灰度,得到所述初始注意力图对应的处理后注意力图。基于所述处理后注意力图中目标灰度的像素,确定内容检测区域。对所述目标图像中对应的所述内容检测区域进行针对所述目标内容实体的内容检测。
-
公开(公告)号:CN116662998A
公开(公告)日:2023-08-29
申请号:CN202310630913.0
申请日:2023-05-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F21/56 , G06F18/214 , G06F18/22 , G06F18/23 , G06N3/0455 , G06N3/08
Abstract: 本说明书一个或多个实施例公开了一种模型的处理方法、装置及设备。该方法包括:以应用程序的静态特征作为原始训练样本,基于该原始训练样本构建其对应的正样本对,该正样本对中至少包括通过数据增强处理生成的正样本构建的正样本对;将正样本对中的每个正样本分别输入第一编码器和第二编码器中,得到每个正样本标签相关和标签无关的两种表征信息;根据表征信息确定正样本对对应的损失信息,且该损失信息中至少包括基于同一个正样本的标签相关的表征信息以及标签无关的表征信息所构建的损失信息;最后基于损失信息对目标编码器进行模型训练,得到训练后的目标编码器,且目标编码器为两个编码器中用于生成标签相关的表征信息的编码器。
-
公开(公告)号:CN115730233B
公开(公告)日:2023-07-11
申请号:CN202211338452.1
申请日:2022-10-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/24 , G06F18/25 , G06N3/04 , G06N3/0464 , G06Q30/0282
Abstract: 本说明书公开了一种数据处理方法、装置、可读存储介质以及电子设备,通过将获取到的用户数据输入到包含风险识别层和辅助识别层的分类模型中,得到风险识别层输出的该用户数据对应的风险类型,以及该辅助识别层输出的该投诉数据满足的风险条件,再根据确定出的风险类型和风险条件,确定该投诉数据对应的处理结果。本说明书中的数据处理方法,不仅能准确确定投诉数据对应的风险类型,还能给出该投诉数据满足的风险条件,以对得到的风险类型进行解释,提高了数据处理的准确率。
-
-
-
-
-
-
-
-
-