-
公开(公告)号:CN111524150B
公开(公告)日:2021-06-11
申请号:CN202010631309.6
申请日:2020-07-03
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种图像处理的方法,巧妙利用特征金字塔网络,根据高阶特征图和低阶特征图的不同特性,基于金字塔状排布的特征图,通过低阶特征图进行语义分割,通过高阶特征图进行实例分割,从而,在一个网络中实现全景分割,实现了一种轻量级的、计算速度较快的全景分割模式。
-
公开(公告)号:CN114925813B
公开(公告)日:2024-10-18
申请号:CN202210573722.0
申请日:2022-05-25
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/045 , G06N3/0464 , G06N3/084 , G06V10/774 , G06V10/764 , G06V10/25 , G06V10/82
Abstract: 本说明书实施例提供一种目标检测系统的训练方法,所述目标检测系统包括主干网络和头部网络,所述主干网络包括若干卷积层和若干自注意力层,所述方法包括:将训练图片输入所述目标检测系统,其中,利用所述若干卷积层对所述训练图片进行卷积处理,得到卷积表征;利用所述若干注意力层基于所述卷积表征进行自注意力处理,得到特征图;利用所述头部网络处理所述特征图,得到所述训练图片中目标对象的检测结果;基于所述训练图片对应的对象标注数据以及所述检测结果,确定各个神经网络层各自的梯度范数;针对所述各个神经网络层,根据所述梯度范数的平均数和其自身的梯度范数,更新其网络参数。
-
公开(公告)号:CN116524188A
公开(公告)日:2023-08-01
申请号:CN202310486635.6
申请日:2023-04-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/26 , G06V20/13 , G06V10/764 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/08 , G06N3/0455 , G06N3/09 , G06N5/04
Abstract: 公开了一种用于对遥感影像执行语义分割的方法,包括:使用语义分割网络对遥感影像执行语义分割,使用知识推理模块基于遥感领域知识图谱对语义分割结果执行知识推理,以及将知识推理得到的消息作为辅助信息输入至语义分割网络,对遥感影像再次执行语义分割。还公开了用于对遥感影像执行语义分割的系统、装置和介质。
-
公开(公告)号:CN114880517B
公开(公告)日:2024-10-22
申请号:CN202210592045.7
申请日:2022-05-27
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/73 , G06F16/783 , G06F16/75
Abstract: 本说明书实施例提供了用于视频检索的方法及装置。在该方法中,获取待匹配视频中的视频帧图像;从视频帧图像中提取图像特征以及文本特征;根据用于表征聚类中心的中心变量对图像特征和所述文本特征进行特征融合,以得到融合特征,其中,中心变量用于将属于同一视频的不同模态的特征进行关联;以及根据融合特征在视频数据库中进行视频检索,以确定出视频数据库中与待匹配视频相匹配的视频,其中,视频数据库中存储有多个视频以及每个视频对应的视频特征。
-
公开(公告)号:CN113076433A
公开(公告)日:2021-07-06
申请号:CN202110454387.8
申请日:2021-04-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/38 , G06F16/33 , G06F16/583 , G06N3/04 , G06N3/08
Abstract: 本说明书实施例提供一种具有多模态信息的检索对象的检索方法和装置,方法包括:获取单模态的查询信息,单模态的查询信息为第一文本或第一图片;当查询信息为第一文本时,将第一文本输入生成模型,生成与第一文本包含的主体对应的图像特征;将第一文本对应的文本特征和图像特征输入图文转换器,对文本特征和图像特征进行基于自注意力的融合,输出查询信息的第一查询特征向量;根据第一查询特征向量与各检索特征向量之间的相似度,确定与查询信息相匹配的检索对象;各检索特征向量分别对应于数据库中的各检索对象,任一检索特征向量为将其对应的检索对象的多模态信息输入图文转换器得到的。能够提高检索精度。
-
公开(公告)号:CN111524150A
公开(公告)日:2020-08-11
申请号:CN202010631309.6
申请日:2020-07-03
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种图像处理的方法,巧妙利用特征金字塔网络,根据高阶特征图和低阶特征图的不同特性,基于金字塔状排布的特征图,通过低阶特征图进行语义分割,通过高阶特征图进行实例分割,从而,在一个网络中实现全景分割,实现了一种轻量级的、计算速度较快的全景分割模式。
-
公开(公告)号:CN116644185A
公开(公告)日:2023-08-25
申请号:CN202310201791.3
申请日:2023-02-23
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 公开了一种用于生成遥感领域知识图谱的方法,包括:至少获取遥感影像数据和文本数据;对该遥感影像数据和该文本数据执行实体发现和关系发现,以标识实体以及实体间的关系;以及基于该实体和该实体间的关系来构建遥感领域知识图谱。本申请还涉及用于生成遥感领域知识图谱的系统、装置和介质。
-
公开(公告)号:CN114092804A
公开(公告)日:2022-02-25
申请号:CN202111309422.3
申请日:2021-11-06
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种遥感图像的识别方法和装置。该方法包括:获取对应于同一地块的至少两张遥感图像;该至少两张遥感图像是在至少两个不同时间上对该同一地块进行拍摄后得到的;对所述至少两张遥感图像分别进行特征提取,得到至少两张原始特征图;根据每一张原始特征图对应的遥感图像的拍摄时间,对所述至少两张原始特征图在时序上进行信息融合,得到融合特征图;利用该融合特征图,对遥感图像进行识别。本说明书能够更为准确地对遥感图像进行识别。
-
公开(公告)号:CN114092804B
公开(公告)日:2025-02-21
申请号:CN202111309422.3
申请日:2021-11-06
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种遥感图像的识别方法和装置。该方法包括:获取对应于同一地块的至少两张遥感图像;该至少两张遥感图像是在至少两个不同时间上对该同一地块进行拍摄后得到的;对所述至少两张遥感图像分别进行特征提取,得到至少两张原始特征图;根据每一张原始特征图对应的遥感图像的拍摄时间,对所述至少两张原始特征图在时序上进行信息融合,得到融合特征图;利用该融合特征图,对遥感图像进行识别。本说明书能够更为准确地对遥感图像进行识别。
-
公开(公告)号:CN116740745A
公开(公告)日:2023-09-12
申请号:CN202310659522.1
申请日:2023-06-05
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/413 , G06V30/19 , G06N3/0455
Abstract: 本说明书实施例提供用于检测图片数据中的文字区域的方法及装置。在该方法中,从图片数据中提取特征图;以及对图片数据中的各个像素点的像素点位置进行二维位置编码,得到各个像素点的位置编码嵌入。随后,使用特征图中的各个像素点的像素点特征嵌入以及对应的位置编码嵌入进行编码,得到各个像素点的编码输出嵌入;并且根据各个像素点的编码输出嵌入确定所述候选文字区域集。接着,使用各个像素点的编码输出嵌入以及候选文字区域集中的各个候选文字区域的位置编码嵌入进行解码,得到各个候选文字区域的解码输出嵌入,每个候选文字区域包括定义用于拟合该候选文字区域的区域边界的两条贝塞尔曲线的控制点集,以及每个候选文字区域的位置编码嵌入包括对应控制点集中的各个控制点的位置编码嵌入。然后,根据各个候选文字区域的解码输出嵌入,在各个候选文字区域中预测目标文字区域。
-
-
-
-
-
-
-
-
-