-
公开(公告)号:CN116227432A
公开(公告)日:2023-06-06
申请号:CN202310199456.4
申请日:2023-02-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/12 , G06F40/126 , G06V30/19
Abstract: 本说明书实施例公开了一种文本处理、同形异码字确定方法、装置和设备,所述文本处理方法可在获取待处理文本后,针对所述待处理文本中的第一字符,确定目标字符集中是否包含所述第一字符,其中,所述第一字符为所述待处理文本中的任一字符,所述目标字符集中的字符能够被后续文本处理任务正确处理;在所述目标字符集中不包含所述第一字符的情况下,确定所述目标字符集中是否存在第二字符,其中,所述第二字符为所述第一字符在所述目标字符集中的同形异码字;在所述目标字符集中存在所述第二字符的情况下,将所述待处理文本中的所述第一字符替换为所述第二字符。
-
公开(公告)号:CN116189201A
公开(公告)日:2023-05-30
申请号:CN202310202854.7
申请日:2023-02-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/19 , G06V30/414 , G06V30/18 , G06V30/14 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/047 , G06N3/09
Abstract: 本说明书实施例提供图像识别方法以及装置,其中所述图像识别方法包括:获取目标凭证图像;将目标凭证图像输入凭证识别模型,通过凭证识别模型的编码单元对目标凭证图像进行编码,获得图像布局特征以及字符特征,通过凭证识别模型的解码单元对图像布局特征和字符特征进行融合,对融合结果进行解码,获得凭证识别模型输出的凭证行序列;对凭证行序列进行格式转换,获得目标凭证图像对应的目标表格。实现了通过编码单元和解码单元的算法框架对目标凭证图像中的图像布局特征以及字符特征进行融合解码,获得凭证识别结果,避免了采用多个模型串联的结构进行凭证识别,缩短了传统凭证识别方法的模型链路,并降低了模型部署的成本。
-
公开(公告)号:CN115797954A
公开(公告)日:2023-03-14
申请号:CN202211513699.2
申请日:2022-11-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/412 , G06V30/413 , G06V10/82 , G06N3/0464
Abstract: 本说明书实施例公开了一种表格识别方法、装置、电子设备、介质及程序产品。其中,该方法包括:获取包含表格的目标图像,并基于上述目标图像确定上述表格对应的全局关系信息,上述全局关系信息包括表格中各目标文字之间的关系以及各目标单元格之间的关系,以及基于上述全局关系信息确定上述表格对应的局部关系信息,上述局部关系信息包括表格中各第一区域内的各目标文字之间的关系以及该表格中各第二区域内的各目标单元格之间的关系,最后基于上述局部关系信息重构上述目标图像中的表格。
-
公开(公告)号:CN115145928A
公开(公告)日:2022-10-04
申请号:CN202210914555.1
申请日:2022-08-01
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/22 , G06F16/2458 , G06F16/28 , G06F16/783
Abstract: 本说明书实施例提供了模型训练方法及装置、结构化摘要获取方法及装置。在针对结构化摘要模型的训练方法中,获取包括多轮对话的对话文本;将结构化摘要模型所应用的表单中的各个字段对应的字段标记添加至对话文本中,以得到带有字段标记的第一对话文本;按照第一对话文本中的各个字段标记的顺序,将各个字段对应的标签进行拼接,以得到标签文本,其中,标签文本中的相邻两个标签之间使用分隔符来隔离;以及使用第一对话文本和标签文本对结构化摘要模型进行训练。
-
公开(公告)号:CN113657112A
公开(公告)日:2021-11-16
申请号:CN202110949956.6
申请日:2021-08-18
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/295 , G06F40/211 , G06F40/30 , G06K9/62
Abstract: 本说明书实施例提供解读文章的方法以及装置,其中所述解读文章的方法包括:从文章中,根据用于描述文章的多种实体类型,提取出对应的多个实体;利用提取出的多个实体以及文章的文本进行关系抽取,得到实体之间的关联关系;基于实体之间的关联关系,构建出用于描述所述文章的多元组森林,所述多元组森林包括以实体作为节点、以实体间关联关系作为边的一个或多个树形结构;将所述多元组森林输入解读规则引擎,得到解读结果。该方法针对文章文本的复杂性,将文章文本结构化为多元组森林,由多元组森林准确完整地描述文章内容,再将多元组森林输入基于多元组森林结构构建的解读规则引擎进行解读,能够准确地得到解读结果,实现准确高效的文章解读。
-
公开(公告)号:CN119625750A
公开(公告)日:2025-03-14
申请号:CN202411611950.8
申请日:2024-07-17
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了文档图像的处理方法及装置,其中,一种文档图像的处理方法包括:在文档图像的解析过程中,一方面对文档图像中的图像块进行特征提取获得图像特征,基于虚拟文本特征与图像特征进行注意力计算并根据获得的注意力权重和图像特征计算注意力图像特征,另一方面对文档图像的解析任务文本进行特征提取获得文本特征,将两方面获得的文本特征与注意力图像特征进行拼接获得拼接特征并输入大模型,由大模型的处理模块按照文本特征对注意力图像特征进行图像解析处理获得图像解析结果,以此在多模态特征拼接的基础上实现文档图像的解析。
-
公开(公告)号:CN118521274B
公开(公告)日:2024-12-31
申请号:CN202410985030.6
申请日:2024-07-22
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了基于策略树的项目处理方法及装置,其中,一种基于策略树的项目处理方法包括:获取进行项目核赔处理的目标核赔提示词的过程中,获取保障项目的核赔提示词作为进行策略树计算的第一节点,将核赔事件和核赔提示词输入预训练模型,以按照核赔提示词中的核赔规则对核赔事件进行核赔处理获得核赔结果,根据核赔结果对核赔提示词进行更新获得更新核赔提示词,并将更新核赔提示词作为进行策略树计算的第二节点,在策略树计算完成后,根据获得的策略树中各策略树路径的路径参数值确定目标核赔提示词,以进行项目核赔处理。
-
公开(公告)号:CN118522018B
公开(公告)日:2024-11-29
申请号:CN202410961302.9
申请日:2024-07-17
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了文档图像的处理方法及装置,其中,一种文档图像的处理方法包括:在文档图像的解析过程中,一方面对文档图像中的图像块进行特征提取获得图像特征,基于虚拟文本特征与图像特征进行注意力计算并根据获得的注意力权重和图像特征计算注意力图像特征,另一方面对文档图像的解析任务文本进行特征提取获得文本特征,将两方面获得的文本特征与注意力图像特征进行拼接获得拼接特征并输入大模型,由大模型的处理模块按照文本特征对注意力图像特征进行图像解析处理获得图像解析结果,以此在多模态特征拼接的基础上实现文档图像的解析。
-
公开(公告)号:CN114550156B
公开(公告)日:2024-09-10
申请号:CN202210150893.2
申请日:2022-02-18
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了图像处理方法及装置,其中,一种图像处理方法包括:获取针对参与保障项目的豢养物进行保障申请提交的凭证图像。将所述凭证图像输入卷积神经网络进行图像特征提取获得图像特征向量。以及,对所述凭证图像进行字符识别获得文本特征信息。基于权重向量对和所述图像特征向量确定图像特征向量对。以及,对所述文本特征信息进行编码处理获得文本特征向量,并将所述图像特征向量与所述文本特征向量进行融合获得融合特征向量。将所述图像特征向量对和所述融合特征向量输入注意力模型进行图像标签识别,获得标签识别结果。
-
公开(公告)号:CN114898388B
公开(公告)日:2024-05-24
申请号:CN202210312174.6
申请日:2022-03-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/413 , G06V30/148 , G06V10/80 , G06V10/26
Abstract: 本说明书实施例公开了一种文档图片分类方法、装置、存储介质及电子设备,通过不同的分割单元获取每个分割单元对应的文本信息,以及文本信息对应的图像信息,将上述多个文本信息和多个图像信息作为至少两种模态的信息进行编码融合,从而实现对文档图片的理解和分类,也即利用不同的分割单元对应不同的模态信息实现信息之间互补,从而完成对文档图片的理解和分类。
-
-
-
-
-
-
-
-
-