-
公开(公告)号:CN112288075A
公开(公告)日:2021-01-29
申请号:CN202011052624.X
申请日:2020-09-29
Applicant: 华为技术有限公司
Abstract: 本申请涉及人工智能领域,公开了一种数据处理方法,包括:获取待处理数据以及目标神经网络模型,目标神经网络模型包括第一transformer层,第一transformer层包括第一残差支路和第二残差支路,第一残差支路包括第一注意力头,第二残差支路包括目标前馈层FFN;根据目标神经网络模型对待处理数据进行目标任务相关的处理,以得到数据处理结果,其中目标神经网络模型用于将第一注意力头的输出与第一权重值进行目标运算,得到第一残差支路的输出,和/或目标神经网络模型用于将目标FFN的输出与第二权重值进行目标运算,得到第二残差支路的输出。本实施例针对于不同的任务,设置了用于控制残差支路的输出的权重值,降低了终端设备运行目标神经网络模型的计算资源需求。
-
公开(公告)号:CN120012906A
公开(公告)日:2025-05-16
申请号:CN202311524978.3
申请日:2023-11-15
Applicant: 华为技术有限公司
IPC: G06N5/04 , G06N3/0455 , G06F18/21 , G06F18/27
Abstract: 一种数据处理方法,应用于人工智能领域,所述方法包括:根据第一数据,通过第一网络,生成第二数据;根据所述第一数据,通过第二网络,生成第三数据;其中,所述第一网络包括第一网络层,所述第二网络包括第二网络层,所述第一网络层为所述第二网络层的部分网络;根据所述第三数据,对所述第二数据进行验证。本申请将进行数据验证过程的网络(第二网络)复用了进行用于生成数据网络(中的一部分,也就是第一网络),可以降低额外的推理部署开销,且第二网络在进行验证时内存可复用第一网络的推理结果,无需额外的时延,降低了计算开销。
-
-
公开(公告)号:CN116415654A
公开(公告)日:2023-07-11
申请号:CN202310353963.9
申请日:2020-02-12
Applicant: 华为技术有限公司
IPC: G06N3/096 , G06N3/082 , G06N3/0455 , G06N3/0499 , G06N3/10
Abstract: 本申请涉及人工智能领域,公开了一种数据处理方法,包括:获取第一神经网络模型和终端设备的可用资源状态;根据所述可用资源状态确定第二神经网络模型。本申请可以根据可用资源状态确定合适的模型尺寸,并根据确定的模型尺寸选择第一神经网络模型中的一部分作为要进行数据处理的第二神经网络模型,减小了模型的大小。
-
公开(公告)号:CN111368993B
公开(公告)日:2023-03-31
申请号:CN202010088948.2
申请日:2020-02-12
Applicant: 华为技术有限公司
IPC: G06N3/096 , G06N3/082 , G06N3/0455 , G06N3/0499 , G06N3/10
Abstract: 本申请涉及人工智能领域,公开了一种数据处理方法,包括:获取第一神经网络模型和终端设备的可用资源状态;根据所述可用资源状态确定第二神经网络模型。本申请可以根据可用资源状态确定合适的模型尺寸,并根据确定的模型尺寸选择第一神经网络模型中的一部分作为要进行数据处理的第二神经网络模型,减小了模型的大小。
-
公开(公告)号:CN115512005A
公开(公告)日:2022-12-23
申请号:CN202211005409.3
申请日:2022-08-22
Applicant: 华为技术有限公司
Abstract: 一种数据处理方法,应用于包含文字的图像的处理,涉及人工智能领域,包括:获取第一特征表示以及第二特征表示,第二特征表示为第一文本的文本特征;第一文本为图像中包括的文本内容;根据第一特征表示以及第二特征表示,通过目标编码器,得到第三特征表示;第三特征表示用于执行下游任务;执行结果和对应的标注之间的相似度以及第一特征表示和第二特征表示之间的相似度用于更新图像编码器。本申请通过先双塔方式可以提升图文之间的对齐能力,再利用一个单塔结构进一步增强特征的交互学习能力。
-
公开(公告)号:CN113505193A
公开(公告)日:2021-10-15
申请号:CN202110611218.0
申请日:2021-06-01
Applicant: 华为技术有限公司
IPC: G06F16/33 , G06F16/332 , G06N3/04 , G06N3/08 , G06N5/04
Abstract: 本申请涉及人工智能领域,公开了一种数据处理方法,包括:获取包括目标网络层以及目标模块的transformer模型,通过transformer模型对待处理数据进行处理,以得到数据处理结果;其中,目标模块用于对目标网络层的特征图输出进行目标运算,以得到运算结果,并将运算结果与特征图输出进行融合,以得到更新后的特征图输出。本申请在transformer模型中插入了目标模块,将目标模块生成的运算结果与输入进行融合,增加了transformer模型中目标网络层输出的特征图中携带的信息,且由于目标模块本身的参数量以及运算时需要的算力开销很小,相当于在降低模型参数量和算力开销的前提下,提高了模型的数据处理精度。
-
-
-
-
-
-