-
公开(公告)号:CN115525158A
公开(公告)日:2022-12-27
申请号:CN202211262136.0
申请日:2022-10-14
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本发明提供了一种互动处理方法及装置,该方法包括:接收用户手势动作的动态图像;对动态图像进行手势识别,得到动态图像的手势识别结果图像数据;基于该图像数据进行目标检测,确定用户的手形变化和手势运动轨迹;基于手形变化和手势运动轨迹,确定对应的手势以及手势映射的指令;执行该指令。通过对用户上传的包含手势动作的动态图像进行手势识别和目标检测,确定手形变化和手势运动轨迹,确定用户本次手势所代替的指令,执行指令,完成交互,相较于现有技术,不需要专门设备,只需要含有光学摄像头的设备即可,例如手机等轻量级设备,降低了互动成本;且手势可变换,交互方式多样,改善了用户体验感。
-
公开(公告)号:CN117765132A
公开(公告)日:2024-03-26
申请号:CN202410050016.7
申请日:2024-01-11
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06T11/60 , G06N3/0464 , G06N3/09 , G06N3/045
Abstract: 本说明书实施例提供一种图像生成方法、装置、设备与存储介质,该方法包括:通过获取目标事务对象描述文本,将目标事务对象描述文本转换为事务文本嵌入向量,获取标签库,将标签库中的标签转换为标签文本嵌入向量,确认事务文本嵌入向量与标签文本嵌入向量的语义相近程度,基于语义相近程度,从标签库中确认与目标事务对象描述文本相关的目标标签库,获取目标标签库对应的目标预训练模型,将目标事务对象描述文本输入至目标预训练模型,以得到事务对象素材图像。
-
公开(公告)号:CN117456028A
公开(公告)日:2024-01-26
申请号:CN202311397132.8
申请日:2023-10-25
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06T11/00 , G06F16/583 , G06F18/22
Abstract: 本说明书实施例提供了基于文本进行图像生成的方法及装置,其中,一种基于文本进行图像生成的方法包括:在根据描述文本进行图像生成过程中,在对描述文本进行关键词提取获得的文本关键词的基础上生成对应的图像关键词,并通过计算图像关键词与图像库中图像描述文本的相似度确定图像关键词匹配的目标图像库,在参数库中读取目标图像库对应的子模型的模型参数并加载至预训练模型,并通过将图像关键词输入加载获得的图像生成模型进行图像生成获得目标图像。
-
公开(公告)号:CN117115830A
公开(公告)日:2023-11-24
申请号:CN202311057063.6
申请日:2023-08-18
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书一个或多个实施方式提供了一种氛围物料的检测方法及装置,包括将氛围物料的待检测图像输入目标检测模型得到目标检测模型输出的目标类别,对待检测图像进行文本检测得到目标文本,基于目标文本以及预先设置的目标类别对应的预设文本的匹配结果得到检测结果。本说明书的检测方法,充分考虑氛围物料的特点,利用文本检测结合检测模型实现对待检测图像的检测,在少训练样本导致检测模型精度受限的情况下,仍然可以准确检测氛围物料,提高针对氛围物料的检测精度。
-
公开(公告)号:CN117079112A
公开(公告)日:2023-11-17
申请号:CN202311052685.X
申请日:2023-08-18
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/98 , G06V10/774 , G06V10/82 , G06N3/0464
Abstract: 本申请涉及人工智能技术领域,具体提供了一种目标检测的方法、装置、电子设备及存储介质。一种目标检测的方法,包括基于目标检测模型,对待检测图像进行目标对象检测,获得第一检测结果;目标检测模型是基于通过图像增广生成的图像样本训练获得的;基于文本识别模型,对待检测图像进行检测,获得第二检测结果;基于第一检测结果和第二检测结果进行结果验证,获得待检测图像的综合检测结果。这样,可以快速获得检测准确的目标检测模型,并结合文本识别模型进行检测,提高了目标对象检测度。
-
公开(公告)号:CN115660316A
公开(公告)日:2023-01-31
申请号:CN202211137824.4
申请日:2022-09-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q10/0631 , G06Q10/087 , G06Q10/04
Abstract: 本说明书实施例提供资源分配方法以及装置,其中所述资源分配方法包括:根据资源服务方的属性信息、以及相对于历史资源的历史行为信息,确定所述资源服务方的评价结果;根据所述评价结果,对所述资源服务方请求的待获取资源进行调整,获得调整后的更新待获取资源;根据所述更新待获取资源以及当前资源,确定目标资源;根据所述目标资源以及所述评价结果,为所述资源服务方进行资源分配。使得根据目标资源和评价结果对资源服务方进行的资源分配更加合理,能够进一步避免出现向资源服务方分配的资源过多导致的资源积压或者资源过少导致的资源服务方的推广能力的浪费。
-
公开(公告)号:CN119313870A
公开(公告)日:2025-01-14
申请号:CN202411313015.3
申请日:2024-09-19
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书一个或多个实施例提供一种图像中的红章脱敏方法、装置和设备,其中方法包括:获取待处理的目标图像,所述目标图像中包括红章;将所述目标图像进行灰度化处理,转换为灰度图像;针对所述灰度图像,通过最大类间方差法识别图像中的红章区域;对所述红章区域进行脱敏。
-
公开(公告)号:CN117456026A
公开(公告)日:2024-01-26
申请号:CN202311393531.7
申请日:2023-10-25
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06T11/00 , G06F16/583 , G06F40/289 , G06F40/30 , G06F18/22
Abstract: 本说明书实施例提供了图像处理方法及装置,其中,一种图像处理方法包括:获取到进行图像生成的描述文本和主题图像之后,将描述文本中包含的各文本关键词进行转换处理,获得各文本关键词对应的各图像关键词,确定各图像关键词匹配的各目标图像库对应的子模型的模型参数,并将模型参数加载至预训练模型获得图像生成模型,通过图像生成模型基于各图像关键词和基于主题图像确定的主题关键词进行图像生成,获得目标图像。
-
公开(公告)号:CN119276997A
公开(公告)日:2025-01-07
申请号:CN202411295561.9
申请日:2024-09-14
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种图像脱敏方法、装置、设备、介质及程序产品。其中,该方法包括:获取待脱敏图像;利用最大类间差法确定上述待脱敏图像对应的目标分割阈值;基于上述目标分割阈值确定上述待脱敏图像对应的前景区域;上述前景区域用于表征上述待脱敏图像中印章所在的第一敏感区域;对上述待脱敏图像进行扫描,得到上述待脱敏图像中二维码所在的第二敏感区域;将上述待脱敏图像中的上述第一敏感区域和上述第二敏感区域进行打码处理,得到上述待脱敏图像对应的已脱敏图像。
-
公开(公告)号:CN118097690A
公开(公告)日:2024-05-28
申请号:CN202410400072.9
申请日:2024-04-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/40 , G06V20/62 , G06V10/774 , G06V30/18 , G06V30/14
Abstract: 本说明书实施例公开了一种图像问答方法、系统、电子设备及介质。其中,图像问答方法包括获取图像以及图像对应的提问信息;通过图像等势位解析方法对图像进行版面识别,得到图像的文本版面信息;基于预训练模型,确定预训练模型对提问信息以及文本版面信息的模型响应,模型响应为提问信息对应的答案。本说明书实施例提高了视觉问答结果准确率。
-
-
-
-
-
-
-
-
-