-
公开(公告)号:CN112633185B
公开(公告)日:2023-04-18
申请号:CN202011565601.9
申请日:2020-09-04
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V20/10 , G06V20/70 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08 , G06T3/40
Abstract: 本说明书实施例提供一种图像处理的方法和装置,将光谱遥感图像切割为多个待处理图像进行处理,尽可能保留光谱遥感图像的信息。在处理光谱遥感图像时,按照不同的分辨率,对光谱遥感图像在多个尺度(对应分辨率)上进行缩放,从而得到各个尺度分别的语义分割结果,以及相应的注意力图。进一步地,利用注意力图,对各个语义分割结果进行融合。该方法引入注意力图,来描述语义分割的重要度,从而提高目标识别结果的准确度。
-
公开(公告)号:CN115937570A
公开(公告)日:2023-04-07
申请号:CN202211265241.X
申请日:2022-10-14
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/764 , G06Q30/0207 , G06V10/80 , G06V10/82 , G06K7/14
Abstract: 本说明书公开了一种篡改检测方法、装置、计算机程序产品、存储介质及设备,其中方法包括:获取事务图形编码,基于预训练的篡改检测模型提取所述事务图形编码中的篡改特征,并基于所述篡改特征生成所述事务图形编码对应的篡改检测结果,若所述篡改检测结果指示所述事务图形编码被篡改,则拒绝响应所述事务图形编码,并输出篡改警告信息,可以对篡改的事务图形编码进行准确识别并拦截。
-
公开(公告)号:CN115862015A
公开(公告)日:2023-03-28
申请号:CN202211247962.8
申请日:2022-10-12
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/10 , G06V30/19 , G06N3/0464 , G06N3/08
Abstract: 本说明书实施例提供一种文字识别系统的训练方法及装置,其中文字识别系统包括图像表征网络、字符对齐网络和字符分类器。该方法包括:利用数据增广模块对包含标签文本的原始图像进行场景渲染处理,得到增广图像;利用图像表征网络分别处理原始图像和增广图像,对应得到原图表征和增广图表征;利用字符对齐网络分别处理原图表征和增广图表征,分别得到与标签文本中各个字符对应的第一字符表征和第二字符表征;利用字符分类器处理第一字符表征,形成第一预测文本;利用字符对比模块处理第一字符表征和第二字符表征,得到对应相同字符的正表征对和对应不同字符的负表征对;基于第一预测文本、标签文本、正表征对和负表征对,训练文字识别系统。
-
公开(公告)号:CN114925813A
公开(公告)日:2022-08-19
申请号:CN202210573722.0
申请日:2022-05-25
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/04 , G06N3/08 , G06K9/62 , G06V10/774 , G06V10/764 , G06V10/25 , G06V10/82
Abstract: 本说明书实施例提供一种目标检测系统的训练方法,所述目标检测系统包括主干网络和头部网络,所述主干网络包括若干卷积层和若干自注意力层,所述方法包括:将训练图片输入所述目标检测系统,其中,利用所述若干卷积层对所述训练图片进行卷积处理,得到卷积表征;利用所述若干注意力层基于所述卷积表征进行自注意力处理,得到特征图;利用所述头部网络处理所述特征图,得到所述训练图片中目标对象的检测结果;基于所述训练图片对应的对象标注数据以及所述检测结果,确定各个神经网络层各自的梯度范数;针对所述各个神经网络层,根据所述梯度范数的平均数和其自身的梯度范数,更新其网络参数。
-
公开(公告)号:CN114880517A
公开(公告)日:2022-08-09
申请号:CN202210592045.7
申请日:2022-05-27
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/73 , G06F16/783 , G06F16/75
Abstract: 本说明书实施例提供了用于视频检索的方法及装置。在该方法中,获取待匹配视频中的视频帧图像;从视频帧图像中提取图像特征以及文本特征;根据用于表征聚类中心的中心变量对图像特征和所述文本特征进行特征融合,以得到融合特征,其中,中心变量用于将属于同一视频的不同模态的特征进行关联;以及根据融合特征在视频数据库中进行视频检索,以确定出视频数据库中与待匹配视频相匹配的视频,其中,视频数据库中存储有多个视频以及每个视频对应的视频特征。
-
公开(公告)号:CN113688650B
公开(公告)日:2022-06-17
申请号:CN202111117739.7
申请日:2021-09-22
Applicant: 支付宝(杭州)信息技术有限公司 , 蚂蚁区块链科技(上海)有限公司
Inventor: 黄莹 , 黄星 , 廖群伟 , 陈景东 , 王剑 , 刘家佳 , 暨凯祥 , 胡锦华 , 刘雷 , 武琳娟 , 王昊 , 章鹏 , 李莎 , 卢睿 , 杜金泉 , 冯成林 , 张谦 , 苏煜 , 林楠 , 鞠春春 , 吕炯炯 , 朱伟
Abstract: 本公开披露了一种识别图片的方法和装置。所述方法包括:接收扫码图片,所述扫码图片包含商品的营销活动对应的活动码;对所述扫码图片进行图像识别,以确定所述扫码图片是否为目标图片,所述目标图片为对所述商品的实体上的所述活动码进行扫描后得到的图片。
-
公开(公告)号:CN113076433B
公开(公告)日:2022-05-17
申请号:CN202110454387.8
申请日:2021-04-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/38 , G06F16/33 , G06F16/583 , G06N3/04 , G06N3/08
Abstract: 本说明书实施例提供一种具有多模态信息的检索对象的检索方法和装置,方法包括:获取单模态的查询信息,单模态的查询信息为第一文本或第一图片;当查询信息为第一文本时,将第一文本输入生成模型,生成与第一文本包含的主体对应的图像特征;将第一文本对应的文本特征和图像特征输入图文转换器,对文本特征和图像特征进行基于自注意力的融合,输出查询信息的第一查询特征向量;根据第一查询特征向量与各检索特征向量之间的相似度,确定与查询信息相匹配的检索对象;各检索特征向量分别对应于数据库中的各检索对象,任一检索特征向量为将其对应的检索对象的多模态信息输入图文转换器得到的。能够提高检索精度。
-
公开(公告)号:CN111898613B
公开(公告)日:2020-12-25
申请号:CN202011054144.7
申请日:2020-09-30
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了半监督语义分割模型训练方法、识别方法和装置,根据实施例的半监督语义分割模型训练方法,首先通过获取人工对第一图像中的待标注对象进行标注后得到的第一监督数据,进而通过第一监督数据训练得到对待标注对象的识别率相对较高的全监督语义分割模型。利用全监督语义分割模型对未经过人工标注的第二图像中的待标注对象进行标注,得到第二监督数据。再利用经过人工标注得到的第一监督数据和经过全监督语义分割模型标注得到的第二监督数据训练半监督语义分割模型,并利用半监督语义分割模型对第一图像、第二图像和随机扰动项进行识别,得到第三监督数据。最后通过第一、第二和第三监督数据对半监督语义分割模型再次训练。
-
公开(公告)号:CN112070069A
公开(公告)日:2020-12-11
申请号:CN202011245258.X
申请日:2020-11-10
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06K9/00 , G06K9/62 , G06F16/58 , G06F16/583 , G06F16/587 , G06N3/04
Abstract: 本说明书实施例提供了遥感图像的识别方法和装置。根据实施例的方法,首先需要得到待识别的遥感图像和文本识别参考数据,并对遥感图像和文本识别参考数据分别进行特征提取得到图像特征和文本特征。然后将图像特征和文本特征进行融合,得到融合特征,进而利用图像识别模型对融合特征进行识别得到遥感图像的识别结果。如此采用多源信息融合的方式,利用文本特征对图像特征进行筛选,能够提升遥感图像的识别精度。
-
公开(公告)号:CN111931873A
公开(公告)日:2020-11-13
申请号:CN202011040050.4
申请日:2020-09-28
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了图像识别方法和装置。根据实施例的方法,首先需要对待识别图像分别进行两次降尺寸处理,其中一个分支得到保留有待识别图像的全局语义及上下文关系的全局特征,另一个分支得到损失了待识别图像的全局语义但是保留有局部细节的多个第一局部特征。然后利用两个分支协同工作,在特征层面进行了特征共享,使得两个分支能够共享信息,同时关注各自擅长的部分,有效地利用待识别图像的整体和局部信息完成对待识别图像的识别。
-
-
-
-
-
-
-
-
-