-
公开(公告)号:CN113807263A
公开(公告)日:2021-12-17
申请号:CN202111100945.7
申请日:2021-09-18
Applicant: 华为技术有限公司
Abstract: 本申请提供一种图像中字段的处理方法及其相关设备,可基于参考图像中多个第一字段与待处理图像中多个第二字段之间的匹配结果,准确识别出待处理图像中所有第二字段的类别。本申请的方法包括:获取参考图像中的多个第一字段和待处理图像中的多个第二字段;通过字段处理模型获取多个第一字段一一对应的多个第一特征,以及多个第二字段一一对应的多个第二特征;通过字段处理模型基于图匹配算法对多个第一特征以及多个第二特征进行处理,得到多个第一字段和多个第二字段之间的匹配结果;基于匹配结果以及多个第一字段的类别,确定多个第二字段的类别。
-
公开(公告)号:CN112016543B
公开(公告)日:2024-09-20
申请号:CN202010723541.2
申请日:2020-07-24
Applicant: 华为技术有限公司
IPC: G06V30/19 , G06V30/18 , G06V10/26 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/084
Abstract: 本申请涉及人工智能领域中的文本识别技术,公开了一种文本识别网络、神经网络训练的方法以及相关设备,文本识别网络为用于识别图像中字符的神经网络,文本识别网络包括图像特征提取模块,用于获取待识别图像,并对待识别图像进行特征提取,以生成与待识别图像中的第一字符对应的第一特征;文本特征获取模块,用于获取与待识别图像中的第一字符对应的预设字符,并根据预设字符进行文本预测,以生成第一预测字符的语义特征;识别模块,用于根据第一特征和第一预测字符的语义特征执行识别操作,以生成与待识别图像对应的识别结果,根据更多维度的特征执行识别操作;且图像质量问题不会影响预测字符的准确度,有利于提高文本识别结果的准确度。
-
公开(公告)号:CN115640622A
公开(公告)日:2023-01-24
申请号:CN202211131641.1
申请日:2022-09-15
Applicant: 华为技术有限公司
IPC: G06F30/10
Abstract: 本申请涉及一种布局生成方法、装置、存储介质及程序产品,所述方法包括:接收用户输入的与M个元素一一对应的特征属性;根据与M个元素一一对应的特征属性生成第一组隐空间向量;接收用户输入的尺寸参数;根据第一组隐空间向量得到与M个元素一一对应的第一几何属性,第一几何属性指示元素在画布上的位置和大小,画布的分辨率等于尺寸参数指示的分辨率;根据与M个元素一一对应的第一几何属性,在画布上生成包括M个元素的布局。根据本申请实施例的布局生成方法,通过设置画布的尺寸参数可调节,使得在生成布局时能够在符合用户需求的尺寸参数的画布上生成布局,从而提升布局生成方式的灵活性,节省时间成本和人力资源成本。
-
公开(公告)号:CN117079298A
公开(公告)日:2023-11-17
申请号:CN202310866539.4
申请日:2023-07-14
Applicant: 华为技术有限公司
IPC: G06V30/41 , G06V30/18 , G06V30/146 , G06V30/19 , G06V10/82 , G06F40/126 , G06N3/045 , G06N3/084
Abstract: 一种信息提取方法、信息提取系统的训练方法和信息提取系统。信息提取系统在接收到输入图像后,将输入图像提取的视觉特征转换大语言模型可识别的特征。信息提取系统在大语言模型接收到任务指令时,可以直接对视觉特征进行目标信息提取,以得到目标文本,实现大语言模型对不同类型的图像进行信息抽取任务,提高大语言模型的实用场景。
-
公开(公告)号:CN115512005A
公开(公告)日:2022-12-23
申请号:CN202211005409.3
申请日:2022-08-22
Applicant: 华为技术有限公司
Abstract: 一种数据处理方法,应用于包含文字的图像的处理,涉及人工智能领域,包括:获取第一特征表示以及第二特征表示,第二特征表示为第一文本的文本特征;第一文本为图像中包括的文本内容;根据第一特征表示以及第二特征表示,通过目标编码器,得到第三特征表示;第三特征表示用于执行下游任务;执行结果和对应的标注之间的相似度以及第一特征表示和第二特征表示之间的相似度用于更新图像编码器。本申请通过先双塔方式可以提升图文之间的对齐能力,再利用一个单塔结构进一步增强特征的交互学习能力。
-
公开(公告)号:CN112016543A
公开(公告)日:2020-12-01
申请号:CN202010723541.2
申请日:2020-07-24
Applicant: 华为技术有限公司
Abstract: 本申请涉及人工智能领域中的文本识别技术,公开了一种文本识别网络、神经网络训练的方法以及相关设备,文本识别网络为用于识别图像中字符的神经网络,文本识别网络包括图像特征提取模块,用于获取待识别图像,并对待识别图像进行特征提取,以生成与待识别图像中的第一字符对应的第一特征;文本特征获取模块,用于获取与待识别图像中的第一字符对应的预设字符,并根据预设字符进行文本预测,以生成第一预测字符的语义特征;识别模块,用于根据第一特征和第一预测字符的语义特征执行识别操作,以生成与待识别图像对应的识别结果,根据更多维度的特征执行识别操作;且图像质量问题不会影响预测字符的准确度,有利于提高文本识别结果的准确度。
-
-
-
-
-