-
公开(公告)号:CN117079298A
公开(公告)日:2023-11-17
申请号:CN202310866539.4
申请日:2023-07-14
Applicant: 华为技术有限公司
IPC: G06V30/41 , G06V30/18 , G06V30/146 , G06V30/19 , G06V10/82 , G06F40/126 , G06N3/045 , G06N3/084
Abstract: 一种信息提取方法、信息提取系统的训练方法和信息提取系统。信息提取系统在接收到输入图像后,将输入图像提取的视觉特征转换大语言模型可识别的特征。信息提取系统在大语言模型接收到任务指令时,可以直接对视觉特征进行目标信息提取,以得到目标文本,实现大语言模型对不同类型的图像进行信息抽取任务,提高大语言模型的实用场景。
-
公开(公告)号:CN110705564B
公开(公告)日:2023-04-18
申请号:CN201910846856.3
申请日:2019-09-09
Applicant: 华为技术有限公司
IPC: G06V10/44 , G06V10/774
Abstract: 本申请提供了图像识别的方法和装置。涉及人工智能领域,具体涉及计算机视觉领域。该方法包括:获取至少两个物体的第一图像;获取位置信息,位置信息指示所述至少两个物体中的第一物体和第二物体在第一图像中的位置;使用第一模型和位置信息对第一图像进行处理,以获取第一物体和第二物体的物体特征;获取第一图像的边缘信息;根据边缘信息、物体特征,使用第二模型识别所述第一物体和所述第二物体的连接状态。根据图像中的边缘信息和物体的特征,能够确定物体的连接状态。
-
公开(公告)号:CN115512005A
公开(公告)日:2022-12-23
申请号:CN202211005409.3
申请日:2022-08-22
Applicant: 华为技术有限公司
Abstract: 一种数据处理方法,应用于包含文字的图像的处理,涉及人工智能领域,包括:获取第一特征表示以及第二特征表示,第二特征表示为第一文本的文本特征;第一文本为图像中包括的文本内容;根据第一特征表示以及第二特征表示,通过目标编码器,得到第三特征表示;第三特征表示用于执行下游任务;执行结果和对应的标注之间的相似度以及第一特征表示和第二特征表示之间的相似度用于更新图像编码器。本申请通过先双塔方式可以提升图文之间的对齐能力,再利用一个单塔结构进一步增强特征的交互学习能力。
-
公开(公告)号:CN113435451A
公开(公告)日:2021-09-24
申请号:CN202110718174.1
申请日:2021-06-28
Applicant: 华为技术有限公司
Abstract: 本申请涉及人工智能技术领域,涉及人工智能网络下的图像处理或字符序列处理技术,具体为一种可以识别字符序列的识别模型,其包括编码模块,可以用于根据输入的数据获得上下文特征;第一解码模块,可以用于根据上下文特征获得识别的字符序列,其中,第一解码模块包括:字符位置预测模块,可以用于根据上下文特征获得特征图,特征图反映了字符序列中的字符的位置信息;第一序列处理模块,可以用于根据上下文特征和特征图获得字符序列。上述识别模型可以使用基于串行注意力的序列解码器、通过知识蒸馏的方式进行训练,从而使得上述识别模型在保持相对高的运行效率下还有较高的文字识别精度。
-
公开(公告)号:CN110705564A
公开(公告)日:2020-01-17
申请号:CN201910846856.3
申请日:2019-09-09
Applicant: 华为技术有限公司
Abstract: 本申请提供了图像识别的方法和装置。涉及人工智能领域,具体涉及计算机视觉领域。该方法包括:获取至少两个物体的第一图像;获取位置信息,位置信息指示所述至少两个物体中的第一物体和第二物体在第一图像中的位置;使用第一模型和位置信息对第一图像进行处理,以获取第一物体和第二物体的物体特征;获取第一图像的边缘信息;根据边缘信息、物体特征,使用第二模型识别所述第一物体和所述第二物体的连接状态。根据图像中的边缘信息和物体的特征,能够确定物体的连接状态。
-
公开(公告)号:CN116882481A
公开(公告)日:2023-10-13
申请号:CN202310629128.3
申请日:2023-05-30
Applicant: 华为技术有限公司
IPC: G06N3/0895 , G06N3/092 , G06N20/00
Abstract: 一种数据处理方法,涉及人工智能领域,方法包括:获取第一提示prompt信息;第一prompt包括第一任务的信息;根据第一任务的信息,通过预训练模型,得到第一控制信息;根据目标物体基于第一控制信息执行第一任务得到的第一执行结果,更新预训练模型,得到更新后的预训练模型;获取第二prompt信息;第二prompt包括第二任务的信息;第二任务的执行复杂度高于第一任务;根据第二任务的信息和目标物体的信息,通过更新后的预训练模型,得到第二控制信息;根据目标物体基于第二控制信息执行第二任务得到的第二执行结果,更新更新后的预训练模型。本申请可以从简单的子技能开始学习,逐步演化学习从简单到复杂的任务技能,可以使得模型学习到较复杂的技能。
-
-
-
-
-