-
公开(公告)号:CN114925813B
公开(公告)日:2024-10-18
申请号:CN202210573722.0
申请日:2022-05-25
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/045 , G06N3/0464 , G06N3/084 , G06V10/774 , G06V10/764 , G06V10/25 , G06V10/82
Abstract: 本说明书实施例提供一种目标检测系统的训练方法,所述目标检测系统包括主干网络和头部网络,所述主干网络包括若干卷积层和若干自注意力层,所述方法包括:将训练图片输入所述目标检测系统,其中,利用所述若干卷积层对所述训练图片进行卷积处理,得到卷积表征;利用所述若干注意力层基于所述卷积表征进行自注意力处理,得到特征图;利用所述头部网络处理所述特征图,得到所述训练图片中目标对象的检测结果;基于所述训练图片对应的对象标注数据以及所述检测结果,确定各个神经网络层各自的梯度范数;针对所述各个神经网络层,根据所述梯度范数的平均数和其自身的梯度范数,更新其网络参数。
-
公开(公告)号:CN118155016A
公开(公告)日:2024-06-07
申请号:CN202410303824.X
申请日:2024-03-15
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/774 , G06V10/74 , G06V10/764 , G06N3/08
Abstract: 本说明书实施例提供一种用于模型训练的数据集的构建方法和装置,方法包括:获取第一数据集,包括若干组初始图文对;针对第一数据集中的任一组初始图文对,计算其包括的初始图片和初始文本的相似度得分;根据相似度得分和预先设定的分数阈值,将第一数据集中的各组初始图文对划分为高质数据、中质数据和低质数据;针对属于中质数据的任一组初始图文对,提取其包括的初始图片,根据该初始图片生成对应的文本描述,利用初始图片和对应的文本描述组成一组更新图文对;将各组更新图文对和属于高质数据的各组初始图文对加入第二数据集,第二数据集作为用于模型训练的数据集。能够获取足够数量的满足要求的训练数据,从而提升模型的训练效果。
-
公开(公告)号:CN117523297A
公开(公告)日:2024-02-06
申请号:CN202311546380.4
申请日:2023-11-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/09
Abstract: 本说明书的实施例提供了一种图像生成模型的训练方法、模型联合训练的方法和装置。在该图像生成模型的训练方法中,利用原始图像数据集循环执行下述模型训练过程:将当前原始图像数据提供给当前图像生成模型,得到修改后图像数据以及对应的用于指示修改信息的标签数据;进而将修改后图像数据提供给基于初始训练样本集进行初始化的当前图像篡改检测模型,得到对应的篡改检测结果;基于所得到的篡改检测结果,确定图像生成模型在当前模型训练过程的奖励值;基于强化学习算法根据所确定的奖励值调整当前图像生成模型的参数,直至满足第一训练结束条件,其中,经过模型参数调整后的图像生成模型充当下一模型训练过程的当前图像生成模型。
-
公开(公告)号:CN116524188A
公开(公告)日:2023-08-01
申请号:CN202310486635.6
申请日:2023-04-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/26 , G06V20/13 , G06V10/764 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/08 , G06N3/0455 , G06N3/09 , G06N5/04
Abstract: 公开了一种用于对遥感影像执行语义分割的方法,包括:使用语义分割网络对遥感影像执行语义分割,使用知识推理模块基于遥感领域知识图谱对语义分割结果执行知识推理,以及将知识推理得到的消息作为辅助信息输入至语义分割网络,对遥感影像再次执行语义分割。还公开了用于对遥感影像执行语义分割的系统、装置和介质。
-
公开(公告)号:CN115953572A
公开(公告)日:2023-04-11
申请号:CN202211580905.1
申请日:2022-12-07
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/25 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本说明书的实施例提供了一种用于确定兴趣区域的方法和装置。在该用于确定兴趣区域的方法中,获取包含目标兴趣点的遥感图像;将包含目标兴趣点的遥感图像提供给兴趣区域确定模型,得到目标数目个兴趣区域边界预测点;根据目标数目个兴趣区域边界预测点,确定包含目标兴趣点的兴趣区域图像待定区域;以及根据兴趣区域图像待定区域,确定包含目标兴趣点的兴趣区域。从而可以实现更为准确地确定包含兴趣点的兴趣区域。
-
公开(公告)号:CN115482548A
公开(公告)日:2022-12-16
申请号:CN202211149551.5
申请日:2022-09-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/412 , G06V30/413 , G06V30/414 , G06N3/04 , G06N3/08 , G06Q40/08 , G06V10/82 , G06V30/16
Abstract: 本说明书提供的表格识别方法和系统,获取包含目标表格的目标表格图像,所述目标表格包括多个文字区域,基于所述多个文字区域的位置从目标表格图像中提取表格结构,表格结构包括多个文字区域在第一方向上分布的位置数据和在第二方向上分布的位置数据,基于表格结构从目标表格图像中提取目标表格的内容数据,并将目标表格的内容数据按照表格结构输出。所述表格识别方法取决于文字区域的位置数据,因此无论目标表格是横平竖直的还是扭曲的,都能准确地识别出来,且不限于是有线的表格还是无线的表格。
-
公开(公告)号:CN111814771B
公开(公告)日:2021-01-05
申请号:CN202010923823.7
申请日:2020-09-04
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种图像处理的方法和装置,将光谱遥感图像切割为多个待处理图像进行处理,尽可能保留光谱遥感图像的信息。在处理光谱遥感图像时,按照不同的分辨率,对光谱遥感图像在多个尺度(对应分辨率)上进行缩放,从而得到各个尺度分别的语义分割结果,以及相应的注意力图。进一步地,利用注意力图,对各个语义分割结果进行融合。该方法引入注意力图,来描述语义分割的重要度,从而提高目标识别结果的准确度。
-
-
-
-
-
-