-
公开(公告)号:CN116246290A
公开(公告)日:2023-06-09
申请号:CN202310197164.7
申请日:2023-02-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/413 , G06V30/414 , G06V30/148 , G06F40/18
Abstract: 本说明书实施例公开了一种字符识别方法、装置、存储介质以及终端,涉及图像处理技术领域。由于在待识别图片中提前绘制了辅助字符识别的第一表格,第一表格中的单元格之间的位置关系也就代表了待识别图片中字符的表格格式,因此基于待识别图片的字符信息以及第一表格的表格信息,可以快速、准确生成待识别图片中表格格式字符对应的表格文件。
-
公开(公告)号:CN115618900A
公开(公告)日:2023-01-17
申请号:CN202211081553.5
申请日:2021-09-22
Applicant: 支付宝(杭州)信息技术有限公司 , 蚂蚁区块链科技(上海)有限公司
IPC: G06K7/14 , G06F18/2415 , G06N3/0464 , G06N3/048 , G06N3/084 , G06Q30/0207
Abstract: 本公开披露了一种识别图片和训练神经网络的方法和装置。方法包括:接收扫码图片,扫码图片包含商品的营销活动对应的活动码;利用图像编码模块对扫码图片进行特征提取,得到第一图像特征;利用注意力模块对第一图像特征进行处理,得到第一图像特征的权重;利用第一图像特征的权重对第一图像特征进行加权,得到第二图像特征;根据第二图像特征对扫码图片进行识别,得到识别结果,识别结果用于确定扫码图片是否为对商品的实体上的活动码进行扫描后得到的图片。
-
公开(公告)号:CN113963352B
公开(公告)日:2022-08-02
申请号:CN202111111792.6
申请日:2021-09-22
Applicant: 支付宝(杭州)信息技术有限公司 , 蚂蚁区块链科技(上海)有限公司
IPC: G06V30/146 , G06K7/14 , G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08 , G06Q30/02
Abstract: 本公开披露了一种识别图片和训练神经网络的方法和装置。方法包括:接收扫码图片,扫码图片包含商品的营销活动对应的活动码;利用图像编码模块对扫码图片进行特征提取,得到第一图像特征;利用注意力模块对第一图像特征进行处理,得到第一图像特征的权重;利用第一图像特征的权重对第一图像特征进行加权,得到第二图像特征;根据第二图像特征对扫码图片进行识别,得到识别结果,识别结果用于确定扫码图片是否为对商品的实体上的活动码进行扫描后得到的图片。
-
公开(公告)号:CN111524150B
公开(公告)日:2021-06-11
申请号:CN202010631309.6
申请日:2020-07-03
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种图像处理的方法,巧妙利用特征金字塔网络,根据高阶特征图和低阶特征图的不同特性,基于金字塔状排布的特征图,通过低阶特征图进行语义分割,通过高阶特征图进行实例分割,从而,在一个网络中实现全景分割,实现了一种轻量级的、计算速度较快的全景分割模式。
-
公开(公告)号:CN111814771A
公开(公告)日:2020-10-23
申请号:CN202010923823.7
申请日:2020-09-04
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种图像处理的方法和装置,将光谱遥感图像切割为多个待处理图像进行处理,尽可能保留光谱遥感图像的信息。在处理光谱遥感图像时,按照不同的分辨率,对光谱遥感图像在多个尺度(对应分辨率)上进行缩放,从而得到各个尺度分别的语义分割结果,以及相应的注意力图。进一步地,利用注意力图,对各个语义分割结果进行融合。该方法引入注意力图,来描述语义分割的重要度,从而提高目标识别结果的准确度。
-
公开(公告)号:CN114092804B
公开(公告)日:2025-02-21
申请号:CN202111309422.3
申请日:2021-11-06
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种遥感图像的识别方法和装置。该方法包括:获取对应于同一地块的至少两张遥感图像;该至少两张遥感图像是在至少两个不同时间上对该同一地块进行拍摄后得到的;对所述至少两张遥感图像分别进行特征提取,得到至少两张原始特征图;根据每一张原始特征图对应的遥感图像的拍摄时间,对所述至少两张原始特征图在时序上进行信息融合,得到融合特征图;利用该融合特征图,对遥感图像进行识别。本说明书能够更为准确地对遥感图像进行识别。
-
公开(公告)号:CN119450026A
公开(公告)日:2025-02-14
申请号:CN202411535402.1
申请日:2024-10-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: H04N13/275 , G06T15/50 , G06N3/0455 , G06N3/08
Abstract: 本说明书一个或多个实施例提供了一种视频数据集构建方法、模型训练方法、视频生成方法及装置。其中,视频数据集构建方法中,在3D照明网络中构建了大量的照明轨迹,然后生成了每条照明轨迹对应的表征光照信息的白板图像的视频和表征3D模型的模型视频。之后,基于表征光照信息的视频和表征模型信息的视频生成了用于训练文本视频生成模型的视频数据集。
-
公开(公告)号:CN116740745A
公开(公告)日:2023-09-12
申请号:CN202310659522.1
申请日:2023-06-05
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/413 , G06V30/19 , G06N3/0455
Abstract: 本说明书实施例提供用于检测图片数据中的文字区域的方法及装置。在该方法中,从图片数据中提取特征图;以及对图片数据中的各个像素点的像素点位置进行二维位置编码,得到各个像素点的位置编码嵌入。随后,使用特征图中的各个像素点的像素点特征嵌入以及对应的位置编码嵌入进行编码,得到各个像素点的编码输出嵌入;并且根据各个像素点的编码输出嵌入确定所述候选文字区域集。接着,使用各个像素点的编码输出嵌入以及候选文字区域集中的各个候选文字区域的位置编码嵌入进行解码,得到各个候选文字区域的解码输出嵌入,每个候选文字区域包括定义用于拟合该候选文字区域的区域边界的两条贝塞尔曲线的控制点集,以及每个候选文字区域的位置编码嵌入包括对应控制点集中的各个控制点的位置编码嵌入。然后,根据各个候选文字区域的解码输出嵌入,在各个候选文字区域中预测目标文字区域。
-
公开(公告)号:CN116521895A
公开(公告)日:2023-08-01
申请号:CN202310493492.1
申请日:2023-04-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/36 , G06F16/35 , G06F16/33 , G06V20/10 , G06V20/13 , G06V10/764 , G06V10/80 , G06V10/40 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N5/02
Abstract: 公开了一种用于生成遥感影像的场景图的方法,包括:生成遥感影像中的目标集合;基于遥感领域知识图谱选择多个存在潜在关系的目标对;以及对目标对执行关系预测以生成该遥感影像的场景图。还公开了用于生成遥感影像的场景图的系统、装置和介质。
-
公开(公告)号:CN116310638A
公开(公告)日:2023-06-23
申请号:CN202310184333.3
申请日:2023-02-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/774 , G06V10/764 , G06F16/36
Abstract: 公开了一种用于跨模态对齐模型的训练方法,包括:获取多个训练样本;以及使用该多个训练样本来训练所述跨模态对齐模型,其中所述跨模态对齐模型将每个样本的视觉特征和语义表示映射到隐层空间,且至少对齐同一场景的该视觉特征与该语义表示在隐层空间的分布。本申请还涉及用于分类器的训练方法、遥感影像场景分类的方法、装置和介质。
-
-
-
-
-
-
-
-
-