-
公开(公告)号:CN117744837B
公开(公告)日:2024-08-20
申请号:CN202311873819.4
申请日:2023-12-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00 , G06F18/214 , G06F18/22 , G06F18/25 , G06F40/205 , G06F40/30 , G06N3/0455 , G06N3/08
Abstract: 本说明书公开一种模型训练、文本检测方法、装置、存储介质及设备,可以通过对不同的互联网平台上公开文本数据集进行整理,同时,通过使用多种常见对话大语言模型和丰富的提示语集合,来构造用于训练检测模型的训练数据,并且,由于在构建用于训练检测模型的训练数据的过程中,针对训练数据进行了多次过滤,使得得到的训练数据更接近于实际场景中的对大语言模型生成的文本进行使用的场景。除此之外,在对检测模型进行训练的过程中,通过使用具有较大参数规模的教师大语言模型输出的依据文本供检测模型学习,从而可以提升训练后的检测模型针对通过大语言模型生成的文本进行识别的准确率。
-
公开(公告)号:CN117422783A
公开(公告)日:2024-01-19
申请号:CN202311206816.5
申请日:2023-09-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06T11/00 , G06V10/40 , G06V10/80 , G06V10/74 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/08
Abstract: 本说明书实施例公开了一种图像样本生成模型的训练方法,包括获取至少一张银行卡图像作为原始图像;基于伪造任务,确定所述原始图像中的伪造区域和伪造内容;基于所述伪造区域,确定位置约束条件文本;确定内容约束条件文本,以描述所述伪造内容;确定内容指导文本,以描述所述伪造任务;将所述原始图像输入预训练的扩散模型中进行图像样本生成,并在反向扩散过程中,通过所述位置约束条件文本、所述内容约束条件文本和所述内容指导文本对所述扩散模型进行微调。相应地,本发明公开了图像样本生成方法及装置。
-
公开(公告)号:CN116974916A
公开(公告)日:2023-10-31
申请号:CN202310835466.2
申请日:2023-07-07
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F11/36
Abstract: 本说明书一个或多个实施例公开了一种测试用例的生成方法,首先获取生成控制条件,该生成控制条件用于生成对待测大模型进行风险评测的测试用例的控制条件,且该生成控制条件中至少包括引导并生成能够评测出待测大模型存在风险的测试用例的引导信息;然后将生成控制条件输入到预先训练的对抗大模型中,得到与生成控制条件相匹配的测试用例,其中,对抗大模型是基于预设的预训练大模型、样例控制条件和样例控制条件对应的目标测试样例,通过预设的损失函数进行模型训练得到的模型,预设的损失函数至少包括基于生成的测试用例之间具有的对抗性而构建的第一子损失函数。
-
公开(公告)号:CN114491448A
公开(公告)日:2022-05-13
申请号:CN202210078449.4
申请日:2022-01-24
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本公开的一方面涉及一种自动化对抗训练方法,包括获取原始训练数据集和经使用所述原始训练数据集训练的模型,所述原始训练数据集包括输入数据及其标签;对所述输入数据自动进行预定步数的扰动,包括对于所述预定步数中的每一步:在预定义的攻击超参数搜索空间中自动搜索对这一步的扰动最优的超参数值;基于所述最优的超参数值自动确定所述这一步的扰动;以及通过纳入所述这一步的扰动来更新所述输入数据;以及使用包括经所述预定步数的扰动之后的经更新输入数据及其标签的对抗训练数据集来进一步优化所述模型以对抗所述扰动。本公开还涉及其他相关方面。
-
公开(公告)号:CN117744837A
公开(公告)日:2024-03-22
申请号:CN202311873819.4
申请日:2023-12-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00 , G06F18/214 , G06F18/22 , G06F18/25 , G06F40/205 , G06F40/30 , G06N3/0455 , G06N3/08
Abstract: 本说明书公开一种模型训练、文本检测方法、装置、存储介质及设备,可以通过对不同的互联网平台上公开文本数据集进行整理,同时,通过使用多种常见对话大语言模型和丰富的提示语集合,来构造用于训练检测模型的训练数据,并且,由于在构建用于训练检测模型的训练数据的过程中,针对训练数据进行了多次过滤,使得得到的训练数据更接近于实际场景中的对大语言模型生成的文本进行使用的场景。除此之外,在对检测模型进行训练的过程中,通过使用具有较大参数规模的教师大语言模型输出的依据文本供检测模型学习,从而可以提升训练后的检测模型针对通过大语言模型生成的文本进行识别的准确率。
-
公开(公告)号:CN117095420A
公开(公告)日:2023-11-21
申请号:CN202310865101.4
申请日:2023-07-13
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/418 , G06V30/18 , G06V30/19 , G06V10/80
Abstract: 本说明书实施例公开了一种图像文本匹配方法,包括:对目标交互页面进行预处理,确定目标交互页面中的元素图像和OCR描述文本的初步匹配关系,得到第一图像文本对;通过预设匹配模型的视觉特征提取网络提取第一图像文本对中元素图像的视觉特征;通过匹配模型的文本特征提取网络提取第一图像文本对中OCR描述文本的第一文本特征,并提取预设分类标签的类别描述文本的第二文本特征;通过匹配模型的特征融合模块对视觉特征、第一文本特征和第二文本特征进行特征融合,得到第三文本特征;通过匹配模型的分类器对第三文本特征和视觉特征进行匹配,得到目标交互页面中元素图像和OCR描述文本的匹配关系。相应地,本发明公开了图像文本匹配装置。
-
公开(公告)号:CN116128072B
公开(公告)日:2023-08-25
申请号:CN202310122752.4
申请日:2023-01-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00 , G06V10/774 , G06F18/214
Abstract: 本说明书公开了一种风险控制模型的训练方法、装置、设备及存储介质,针对该风险控制模型的每个模型参数,确定该模型参数在本次迭代过程中的梯度,作为第一梯度,并确定该模型参数在上一次迭代过程中的梯度,作为第二梯度,根据第一梯度和该第二梯度确定该模型参数的步长参数,再根据预设的学习率、步长参数和第一梯度,确定该模型参数对应的参数调整量,以及根据参数调整量对该模型参数进行调整。本方法中的步长参数在第一梯度和第二梯度方向相同时对应的参数值高于第一梯度和第二梯度方向相反时对应的参数值,因而在模型参数出现震荡时,参数调整量会随之减小,避免了由于参数调整量过大导致模型参数出现持续震荡的情况出现,提高了训练效率。
-
公开(公告)号:CN116128072A
公开(公告)日:2023-05-16
申请号:CN202310122752.4
申请日:2023-01-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00 , G06V10/774 , G06F18/214
Abstract: 本说明书公开了一种风险控制模型的训练方法、装置、设备及存储介质,针对该风险控制模型的每个模型参数,确定该模型参数在本次迭代过程中的梯度,作为第一梯度,并确定该模型参数在上一次迭代过程中的梯度,作为第二梯度,根据第一梯度和该第二梯度确定该模型参数的步长参数,再根据预设的学习率、步长参数和第一梯度,确定该模型参数对应的参数调整量,以及根据参数调整量对该模型参数进行调整。本方法中的步长参数在第一梯度和第二梯度方向相同时对应的参数值高于第一梯度和第二梯度方向相反时对应的参数值,因而在模型参数出现震荡时,参数调整量会随之减小,避免了由于参数调整量过大导致模型参数出现持续震荡的情况出现,提高了训练效率。
-
公开(公告)号:CN115618237A
公开(公告)日:2023-01-17
申请号:CN202211590716.2
申请日:2022-12-12
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/214 , G06F18/24
Abstract: 本说明书提供了一种模型训练的方法、装置、存储介质及电子设备。在本说明书提供的模型训练方法中,获取训练样本、样本标签以及打标环境信息;将所述训练样本输入待训练的目标模型中,确定所述目标模型的输出结果;将所述打标环境信息输入置信度网络中,通过所述置信度网络输出所述样本标签的置信度;根据所述样本标签的置信度,调整所述目标模型的输出结果,得到修正结果;以所述修正结果与所述样本标签之间的差异最小为优化目标,对所述目标模型与所述置信度网络进行训练。采用本说明书提供的模型训练方法对模型进行有监督训练时,能够根据样本标签的可信程度对模型的输出结果进行修正,保证模型的训练效果,同时使标签的利用率最大化。
-
-
-
-
-
-
-
-