-
公开(公告)号:CN116188345A
公开(公告)日:2023-05-30
申请号:CN202310189639.8
申请日:2023-02-23
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种图像处理的方法、训练图像处理模型的方法及装置,涉及图像处理技术领域。主要技术方案包括:分别获取目标图像的第一特征表示和参考图像的第一特征表示;利用所述目标图像的第一特征表示和参考图像的第一特征表示进行注意力机制的处理,利用注意力机制的处理结果预测特征变换参数;利用所述特征变换参数对所述目标图像的第一特征表示进行特征变换,得到所述目标图像的第二特征表示;利用所述目标图像的第二特征表示进行预测,得到合成图像。本公开能够提高合成图像的效果。
-
公开(公告)号:CN115546810A
公开(公告)日:2022-12-30
申请号:CN202211507954.2
申请日:2022-11-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/412 , G06V30/414
Abstract: 本说明书实施例提供一种图像元素类别的识别方法及装置,在识别方法中,从多模态的目标图像中,提取其中包含的多个文本片段,及其对应的多个边界框。针对多个边界框形成的初始集合,迭代执行若干轮次的切分操作,其中单论切分操作根据边界框的轴向投影,将本轮当前集合划分为多个子集合,并确定各个子集合的相对排序,直至得到各个边界框的排序编号,该排序编号指示各个边界框的阅读顺序。至少将多个文本片段、多个边界框及其各自的排序编号,输入类别预测模型进行识别处理,得到目标图像中包含的各个元素的类别。
-