-
公开(公告)号:CN114925813B
公开(公告)日:2024-10-18
申请号:CN202210573722.0
申请日:2022-05-25
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/045 , G06N3/0464 , G06N3/084 , G06V10/774 , G06V10/764 , G06V10/25 , G06V10/82
Abstract: 本说明书实施例提供一种目标检测系统的训练方法,所述目标检测系统包括主干网络和头部网络,所述主干网络包括若干卷积层和若干自注意力层,所述方法包括:将训练图片输入所述目标检测系统,其中,利用所述若干卷积层对所述训练图片进行卷积处理,得到卷积表征;利用所述若干注意力层基于所述卷积表征进行自注意力处理,得到特征图;利用所述头部网络处理所述特征图,得到所述训练图片中目标对象的检测结果;基于所述训练图片对应的对象标注数据以及所述检测结果,确定各个神经网络层各自的梯度范数;针对所述各个神经网络层,根据所述梯度范数的平均数和其自身的梯度范数,更新其网络参数。
-
公开(公告)号:CN118155016A
公开(公告)日:2024-06-07
申请号:CN202410303824.X
申请日:2024-03-15
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/774 , G06V10/74 , G06V10/764 , G06N3/08
Abstract: 本说明书实施例提供一种用于模型训练的数据集的构建方法和装置,方法包括:获取第一数据集,包括若干组初始图文对;针对第一数据集中的任一组初始图文对,计算其包括的初始图片和初始文本的相似度得分;根据相似度得分和预先设定的分数阈值,将第一数据集中的各组初始图文对划分为高质数据、中质数据和低质数据;针对属于中质数据的任一组初始图文对,提取其包括的初始图片,根据该初始图片生成对应的文本描述,利用初始图片和对应的文本描述组成一组更新图文对;将各组更新图文对和属于高质数据的各组初始图文对加入第二数据集,第二数据集作为用于模型训练的数据集。能够获取足够数量的满足要求的训练数据,从而提升模型的训练效果。
-
公开(公告)号:CN115482548A
公开(公告)日:2022-12-16
申请号:CN202211149551.5
申请日:2022-09-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/412 , G06V30/413 , G06V30/414 , G06N3/04 , G06N3/08 , G06Q40/08 , G06V10/82 , G06V30/16
Abstract: 本说明书提供的表格识别方法和系统,获取包含目标表格的目标表格图像,所述目标表格包括多个文字区域,基于所述多个文字区域的位置从目标表格图像中提取表格结构,表格结构包括多个文字区域在第一方向上分布的位置数据和在第二方向上分布的位置数据,基于表格结构从目标表格图像中提取目标表格的内容数据,并将目标表格的内容数据按照表格结构输出。所述表格识别方法取决于文字区域的位置数据,因此无论目标表格是横平竖直的还是扭曲的,都能准确地识别出来,且不限于是有线的表格还是无线的表格。
-
公开(公告)号:CN114925813A
公开(公告)日:2022-08-19
申请号:CN202210573722.0
申请日:2022-05-25
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/04 , G06N3/08 , G06K9/62 , G06V10/774 , G06V10/764 , G06V10/25 , G06V10/82
Abstract: 本说明书实施例提供一种目标检测系统的训练方法,所述目标检测系统包括主干网络和头部网络,所述主干网络包括若干卷积层和若干自注意力层,所述方法包括:将训练图片输入所述目标检测系统,其中,利用所述若干卷积层对所述训练图片进行卷积处理,得到卷积表征;利用所述若干注意力层基于所述卷积表征进行自注意力处理,得到特征图;利用所述头部网络处理所述特征图,得到所述训练图片中目标对象的检测结果;基于所述训练图片对应的对象标注数据以及所述检测结果,确定各个神经网络层各自的梯度范数;针对所述各个神经网络层,根据所述梯度范数的平均数和其自身的梯度范数,更新其网络参数。
-
-
-