-
公开(公告)号:CN119479084A
公开(公告)日:2025-02-18
申请号:CN202411231742.5
申请日:2022-02-25
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V40/40 , G06V40/16 , G06V20/62 , G06V10/40 , G06V10/74 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/0895
Abstract: 本说明书实施例提供图片识别方法及系统,其中所述图片识别方法包括:将待识别图片输入预先训练的图片识别模型,其中,所述图片识别模型基于有标签图片样本以及满足预设规则的无标签图片样本训练获得;获取所述图片识别模型对所述待识别图片的识别结果,基于所述识别结果确定所述待识别图片是否为风险图片。该方法通过基于有标签图片样本以及满足预设规则的无标签图片样本训练获得的图片识别模型,识别输入的待识别图片是否为风险图片,从而提高了风险图片的识别效率,降低了图片验证过程的难度。
-
公开(公告)号:CN118690979A
公开(公告)日:2024-09-24
申请号:CN202411184317.5
申请日:2024-08-26
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书公开了一种决策确定方法、装置、存储介质及电子设备,其中方法包括:获取用于申请事务决策的事务数据集合,以及所述事务数据集合对应的事务决策,对所述事务数据集合和所述事务决策进行特征提取,得到特征数据集合,将所述特征数据集合和所述事务决策输入至预先训练好的置信度模型中,获取所述置信度模型输出的所述事务决策对应的目标置信度,基于所述目标置信度与预设的置信度阈值确定所述事务决策的目标执行方案。采用本说明书,通过对事务数据进行数据提取和分析,并结合事务决策进行判断,进而根据目标置信度确定事务决策对应的目标执行方案,提高了事务数集合的事务决策对应执行方案的准确性和可靠性。
-
公开(公告)号:CN118674831A
公开(公告)日:2024-09-20
申请号:CN202410772207.4
申请日:2024-06-14
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06T11/60 , G06F16/34 , G06F16/335 , G06F40/284 , G06N20/00
Abstract: 本说明书的一个或多个实施例涉及信息技术领域,具体涉及一种图文页面生成方法及装置。所述方法包括步骤:接收指示词及信息源的指定,根据所述指示词及指定的信息源生成第一扩写文本;根据所述第一扩写文本生成第一文本摘要;提取所述第一扩写文本的若干个关键词;根据预设的图片素材为每个所述关键词生成图文元素;根据所述第一文本摘要、所述图片素材及若干个所述图文元素生成至少一个图片元素;生成载有所述第一文本摘要、若干个所述图文元素及所述图片元素的页面。
-
公开(公告)号:CN116863470A
公开(公告)日:2023-10-10
申请号:CN202310606326.8
申请日:2023-05-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/14 , G06V30/148 , G06V30/19 , G06V10/82 , G06N3/0475 , G06N3/094
Abstract: 本说明书公开了一种图像处理模型的训练方法、图像处理方法以及电子设备,方法包括:获取训练图像,所述训练图像包括目标图形;在所述训练图像中进行采样,得到第一样本图像和第二样本图像,所述第一样本图像包括所述目标图形,所述第二样本图像不包括所述目标图形;基于所述第一样本图像和所述第二样本图像,利用生成对抗的方式训练图像处理模型,所述图像处理模型用于去除输入的图像中的目标图形。
-
公开(公告)号:CN114529993B
公开(公告)日:2024-09-24
申请号:CN202210181146.5
申请日:2022-02-25
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V40/40 , G06V40/16 , G06V20/62 , G06V10/40 , G06V10/74 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/0895
Abstract: 本说明书实施例提供图片识别方法及系统,其中所述图片识别方法包括:将待识别图片输入预先训练的图片识别模型,其中,所述图片识别模型基于有标签图片样本以及满足预设规则的无标签图片样本训练获得;获取所述图片识别模型对所述待识别图片的识别结果,基于所述识别结果确定所述待识别图片是否为风险图片。该方法通过基于有标签图片样本以及满足预设规则的无标签图片样本训练获得的图片识别模型,识别输入的待识别图片是否为风险图片,从而提高了风险图片的识别效率,降低了图片验证过程的难度。
-
公开(公告)号:CN118522018A
公开(公告)日:2024-08-20
申请号:CN202410961302.9
申请日:2024-07-17
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了文档图像的处理方法及装置,其中,一种文档图像的处理方法包括:在文档图像的解析过程中,一方面对文档图像中的图像块进行特征提取获得图像特征,基于虚拟文本特征与图像特征进行注意力计算并根据获得的注意力权重和图像特征计算注意力图像特征,另一方面对文档图像的解析任务文本进行特征提取获得文本特征,将两方面获得的文本特征与注意力图像特征进行拼接获得拼接特征并输入大模型,由大模型的处理模块按照文本特征对注意力图像特征进行图像解析处理获得图像解析结果,以此在多模态特征拼接的基础上实现文档图像的解析。
-
公开(公告)号:CN116503876A
公开(公告)日:2023-07-28
申请号:CN202310464514.1
申请日:2023-04-24
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供图像识别模型的训练方法及装置、图像识别方法及装置,其中所述图像识别模型的训练方法包括:获取样本文本图像和样本文本图像的样本文本标签;通过图像识别模型确定样本文本图像对应视觉维度的第一全局特征,以及通过文本识别模型确定样本文本标签对应语言维度的第二全局特征;根据第一全局特征和第二全局特征对图像识别模型进行迭代训练,直至获得满足模型训练结束条件的目标图像识别模型;其中,目标图像识别模型的识别结果融合视觉维度和语言维度分别对应的语义特征。在训练阶段基于第一全局特征和第二全局特征进行迭代训练,使模型具备视觉和语言两种编码能力,提高识别效率和准确率。
-
公开(公告)号:CN116189201A
公开(公告)日:2023-05-30
申请号:CN202310202854.7
申请日:2023-02-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/19 , G06V30/414 , G06V30/18 , G06V30/14 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/047 , G06N3/09
Abstract: 本说明书实施例提供图像识别方法以及装置,其中所述图像识别方法包括:获取目标凭证图像;将目标凭证图像输入凭证识别模型,通过凭证识别模型的编码单元对目标凭证图像进行编码,获得图像布局特征以及字符特征,通过凭证识别模型的解码单元对图像布局特征和字符特征进行融合,对融合结果进行解码,获得凭证识别模型输出的凭证行序列;对凭证行序列进行格式转换,获得目标凭证图像对应的目标表格。实现了通过编码单元和解码单元的算法框架对目标凭证图像中的图像布局特征以及字符特征进行融合解码,获得凭证识别结果,避免了采用多个模型串联的结构进行凭证识别,缩短了传统凭证识别方法的模型链路,并降低了模型部署的成本。
-
公开(公告)号:CN113657112A
公开(公告)日:2021-11-16
申请号:CN202110949956.6
申请日:2021-08-18
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/295 , G06F40/211 , G06F40/30 , G06K9/62
Abstract: 本说明书实施例提供解读文章的方法以及装置,其中所述解读文章的方法包括:从文章中,根据用于描述文章的多种实体类型,提取出对应的多个实体;利用提取出的多个实体以及文章的文本进行关系抽取,得到实体之间的关联关系;基于实体之间的关联关系,构建出用于描述所述文章的多元组森林,所述多元组森林包括以实体作为节点、以实体间关联关系作为边的一个或多个树形结构;将所述多元组森林输入解读规则引擎,得到解读结果。该方法针对文章文本的复杂性,将文章文本结构化为多元组森林,由多元组森林准确完整地描述文章内容,再将多元组森林输入基于多元组森林结构构建的解读规则引擎进行解读,能够准确地得到解读结果,实现准确高效的文章解读。
-
公开(公告)号:CN119625750A
公开(公告)日:2025-03-14
申请号:CN202411611950.8
申请日:2024-07-17
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了文档图像的处理方法及装置,其中,一种文档图像的处理方法包括:在文档图像的解析过程中,一方面对文档图像中的图像块进行特征提取获得图像特征,基于虚拟文本特征与图像特征进行注意力计算并根据获得的注意力权重和图像特征计算注意力图像特征,另一方面对文档图像的解析任务文本进行特征提取获得文本特征,将两方面获得的文本特征与注意力图像特征进行拼接获得拼接特征并输入大模型,由大模型的处理模块按照文本特征对注意力图像特征进行图像解析处理获得图像解析结果,以此在多模态特征拼接的基础上实现文档图像的解析。
-
-
-
-
-
-
-
-
-