-
公开(公告)号:CN115221523A
公开(公告)日:2022-10-21
申请号:CN202211140635.2
申请日:2022-09-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F21/56 , G06F16/958
Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,所述方法包括:获取待检测的目标页面,并将所述目标页面包含的文本信息划分为多个子文本信息;基于每个所述子文本信息对应的文本特征向量、所述目标页面对应的图像特征向量、所述目标页面的布局信息,以及预先训练的类型确定模型,确定所述目标页面的页面类型,所述类型确定模型用于基于多模态数据确定页面的页面类型,所述目标页面的布局信息包括每个所述子文本信息在所述目标页面的第一位置信息,以及所述图像特征向量对应的图像在所述目标页面的第二位置信息;基于所述目标页面的页面类型,确定所述目标页面是否为存在风险的页面。
-
公开(公告)号:CN119254899A
公开(公告)日:2025-01-03
申请号:CN202411375183.5
申请日:2024-09-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: H04N1/32
Abstract: 本说明书实施例公开了一种信息隐写方法、装置及设备,该方法包括:获取待隐写的目标数据和目标水印信息;通过预先训练的隐写编码模型中的一个或多个依次连接的水印嵌入模块,将输入的所述目标数据或时域的数据转换为频域目标数据,基于所述目标水印信息与所述频域目标数据之间的全局关联关系和/或局部关联关系,将所述目标水印信息嵌入所述频域目标数据中,得到频域载水印数据,并将所述频域载水印数据转换为时域的载水印数据;通过所述隐写编码模型中的数据调整模块,对一个或多个依次连接的水印嵌入模块最终输出的时域的载水印数据进行调整,得到所述目标数据对应的目标载水印数据。
-
公开(公告)号:CN113592696B
公开(公告)日:2024-11-12
申请号:CN202110927877.5
申请日:2021-08-12
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06T1/00 , G06F21/60 , G06F21/62 , G06V40/16 , G06V10/74 , G06V10/77 , G06V10/764 , G06N3/0464 , G06N3/084
Abstract: 本说明书实施例提供一种用于隐私保护的加密模型训练方法及装置、图像加密方法及装置和加密人脸图像识别方法及装置,该加密模型训练方法包括:利用待训练的加密模型对原始人脸图像加密,得到加密人脸图像;将加密人脸图像输入待训练的第一人脸识别模型,得到第一人脸预测结果;利用第一人脸预测结果和原始人脸图像对应的人脸标注结果,确定第一预测损失;将加密人脸图像输入判别模型,通过判别模型得到加密人脸图像为噪声图像的第一预测概率;根据与第一预测损失正相关,与第一预测概率负相关确定总预测损失;以最小化总预测损失为目标,训练加密模型以及第一人脸识别模型。
-
公开(公告)号:CN113486839B
公开(公告)日:2024-10-22
申请号:CN202110822280.4
申请日:2021-07-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V40/16 , G06F21/60 , G06N3/0464 , G06N3/084
Abstract: 本说明书实施例提供一种加密模型训练方法及装置、图像加密方法及装置和加密人脸图像识别方法及装置,该加密模型训练方法包括:利用待训练的加密模型对原始人脸图像加密,得到加密人脸图像;将加密人脸图像输入待训练的第一人脸识别模型,得到第一人脸预测结果;利用第一人脸预测结果及原始人脸图像对应的人脸标注结果,确定第一预测损失;分别将原始人脸图像及加密人脸图像输入经训练的第二人脸识别模型,得到各自对应的第一输出结果及第二输出结果;基于第一输出结果及第二输出结果,确定第二预测损失;基于与第一预测损失和第二预测损失正相关,确定总预测损失;以最小化总预测损失为目标,训练加密模型以及第一人脸识别模型。
-
公开(公告)号:CN118411282A
公开(公告)日:2024-07-30
申请号:CN202410693982.0
申请日:2024-05-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06T1/00 , G06T5/70 , G06T5/60 , G06N3/0455 , G06N3/08
Abstract: 本说明书实施例提供了一种水印嵌入检出的联合训练方法、装置、存储介质及设备,其中方法包括:获取训练样本,训练样本包括图像水印、样本原始图像,基于图像编码器对图像水印进行编码处理,得到图像水印对应的嵌入水印表征,然后将嵌入水印表征和样本原始图像输入至水印编码器中,以使水印编码器将嵌入水印表征融合进样本原始图像,得到嵌入图像水印的水印嵌入图像,再将水印嵌入图像输入至水印解码器中,得到水印嵌入图像对应的检出水印,最后以检出水印和图像水印的差异最小化、水印嵌入图像和样本原始图像的差异最小化为优化目标,调整图像编码器、水印编码器和水印解码器的参数。
-
公开(公告)号:CN117523323B
公开(公告)日:2024-05-14
申请号:CN202410010345.9
申请日:2024-01-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/764 , G06V10/74 , G06V10/82
Abstract: 本说明书一个或多个实施例公开了一种生成图像的检测方法及装置,该方法首先获取目标图像,其次从目标图像中选取部分图像,并基于目标图像中除部分图像之外的剩余图像对部分图像进行重构处理,获取剩余图像和重构的部分图像所组成的重构图像,然后将重构图像输入预先训练的分类模型,得到重构图像的重构效果类别,最后根据重构图像的重构效果类别,确定目标图像是真实图像或生成图像。
-
公开(公告)号:CN117392694B
公开(公告)日:2024-04-19
申请号:CN202311674312.6
申请日:2023-12-07
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/40 , G06V30/418 , G06V30/19 , G06V30/164
Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,其中,该方法包括:获取与目标文本匹配的目标风险关键词,并获取目标文本与目标风险关键词之间的匹配度;通过预先训练的扩散生成模型,对目标文本进行加噪处理,得到与目标文本对应的第一图像表征;通过预先训练的扩散生成模型,经过预设迭代次数逐次对第一图像表征进行降噪处理,直到最后一次迭代过程结束,得到预先训练的扩散生成模型的输出端的元函数;基于迭代结束得到的预先训练的扩散生成模型的输出端的元函数、目标文本、目标风险关键词以及最后一次迭代过程对应的噪声,生成与目标文本对应的第二图像表征,并基于第二图像表征,确定与目标文本对应的目标图像。
-
公开(公告)号:CN117523323A
公开(公告)日:2024-02-06
申请号:CN202410010345.9
申请日:2024-01-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/764 , G06V10/74 , G06V10/82
Abstract: 本说明书一个或多个实施例公开了一种生成图像的检测方法及装置,该方法首先获取目标图像,其次从目标图像中选取部分图像,并基于目标图像中除部分图像之外的剩余图像对部分图像进行重构处理,获取剩余图像和重构的部分图像所组成的重构图像,然后将重构图像输入预先训练的分类模型,得到重构图像的重构效果类别,最后根据重构图像的重构效果类别,确定目标图像是真实图像或生成图像。
-
公开(公告)号:CN117392694A
公开(公告)日:2024-01-12
申请号:CN202311674312.6
申请日:2023-12-07
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/40 , G06V30/418 , G06V30/19 , G06V30/164
Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,其中,该方法包括:获取与目标文本匹配的目标风险关键词,并获取目标文本与目标风险关键词之间的匹配度;通过预先训练的扩散生成模型,对目标文本进行加噪处理,得到与目标文本对应的第一图像表征;通过预先训练的扩散生成模型,经过预设迭代次数逐次对第一图像表征进行降噪处理,直到最后一次迭代过程结束,得到预先训练的扩散生成模型的输出端的元函数;基于迭代结束得到的预先训练的扩散生成模型的输出端的元函数、目标文本、目标风险关键词以及最后一次迭代过程对应的噪声,生成与目标文本对应的第二图像表征,并基于第二图像表征,确定与目标文本对应的目标图像。
-
公开(公告)号:CN117095420A
公开(公告)日:2023-11-21
申请号:CN202310865101.4
申请日:2023-07-13
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/418 , G06V30/18 , G06V30/19 , G06V10/80
Abstract: 本说明书实施例公开了一种图像文本匹配方法,包括:对目标交互页面进行预处理,确定目标交互页面中的元素图像和OCR描述文本的初步匹配关系,得到第一图像文本对;通过预设匹配模型的视觉特征提取网络提取第一图像文本对中元素图像的视觉特征;通过匹配模型的文本特征提取网络提取第一图像文本对中OCR描述文本的第一文本特征,并提取预设分类标签的类别描述文本的第二文本特征;通过匹配模型的特征融合模块对视觉特征、第一文本特征和第二文本特征进行特征融合,得到第三文本特征;通过匹配模型的分类器对第三文本特征和视觉特征进行匹配,得到目标交互页面中元素图像和OCR描述文本的匹配关系。相应地,本发明公开了图像文本匹配装置。
-
-
-
-
-
-
-
-
-