-
公开(公告)号:CN117437440A
公开(公告)日:2024-01-23
申请号:CN202210801213.9
申请日:2022-07-08
Applicant: 华为云计算技术有限公司
IPC: G06V10/72 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/084
Abstract: 一种模型训练方法,应用于人工智能领域,能够提高模型的领域泛化能力。该方法中,模型在训练过程中基于输入图像的特征统计信息和其他域的图像的特征统计信息来预测输入图像所在域的特征统计信息,进而基于输入图像所在域的特征统计信息对输入图像进行处理。由于模型在预测特征统计信息的过程中,既考虑了输入图像与其他域的图像之间的共性,还结合了输入图像本身的特征分布独特性,因此模型能够有效地预测得到输入图像所在域的特征分布信息。这样一来,在模型学会预测输入图像所在域的特征分布的基础上,能够基于输入图像所在域的特征分布对输入图像进行处理,有效地提高了模型的领域泛化能力。
-
公开(公告)号:CN116796760A
公开(公告)日:2023-09-22
申请号:CN202210244066.X
申请日:2022-03-11
Applicant: 华为云计算技术有限公司
IPC: G06F40/58 , G06F40/205 , G06F40/30 , G06F18/214 , G06F40/189
Abstract: 本申请提供一种翻译系统及其训练、应用方法与相关设备,该翻译系统包括第一语言模型和第二语言模型,第一语言模型包括第一编码器、第一对齐编码器、第一对齐解码器和第一解码器,第二语言模型包括第二编码器、第二对齐编码器、第二对齐解码器和第二解码器,通过平行语料对所述第一语言模型和所述第二语言模型进行训练,得到训练好的所述第一语言模型和所述第二语言模型;通过对训练好的第一语言模型和第二语言模型中的编码器和解码器进行组合,即可实现第一语言和第二语言之间的相互翻译。通过使用本申请提供的翻译系统,能够提高翻译系统的训练效率,节约计算资源,并能够提高翻译系统的可扩展性。
-
公开(公告)号:CN116563660A
公开(公告)日:2023-08-08
申请号:CN202210109103.6
申请日:2022-01-28
Applicant: 华为云计算技术有限公司
IPC: G06V10/774 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/044 , G06N3/045 , G06N3/096
Abstract: 本申请公开了一种基于预训练大模型的图像处理方法及相关装置,通过生成网络获取训练图像的特征图像,特征图像的分辨率与训练图像的分辨率相同;将训练图像和特征图像进行融合,得到目标图像;将目标图像输入到预训练大模型中,得到处理结果;根据处理结果,在保持预训练大模型的参数不变的情况下,对生成网络的参数进行更新。本申请中,针对每个下游任务配置了生成网络,在训练过程中,在保持预训练大模型的参数不变的情况下,对生成网络的参数进行更新,从而减少了在下游任务上部署预训练大模型时的训练开销,减少了模型训练难度与迭代更新的难度。
-
公开(公告)号:CN112561028B
公开(公告)日:2024-10-22
申请号:CN201910914033.X
申请日:2019-09-25
Applicant: 华为云计算技术有限公司
IPC: G06N3/045 , G06N3/0464 , G06N3/084 , G06N3/0985
Abstract: 本申请属于人工智能领域的计算机视觉领域。本申请提供了一种训练神经网络模型的方法,包括:获取多个构建单元以及待训练数据;堆叠多个构建单元得到初始神经网络模型,初始神经网络模型的参数包括结构参数以及权重参数;将待训练数据输入初始神经网络模型,并根据第一损失函数对权重参数求二阶梯度得到的梯度值,对结构参数进行更新,以得到满足预设要求、用于识别多媒体数据的神经网络模型,第一损失函数用于对权重参数更新。本申请提供一种训练神经网络模型的方法、数据处理的方法及设备,目的在于提供一种精确识别多媒体数据的方法。
-
公开(公告)号:CN117291939A
公开(公告)日:2023-12-26
申请号:CN202210673993.3
申请日:2022-06-15
Applicant: 华为云计算技术有限公司
IPC: G06T7/12 , G06T7/136 , G06T7/194 , G06T7/33 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本申请实施例提供一种分割模型训练方法及装置。涉及人工智能领域,具体涉及计算机视觉领域。该方法包括:获取训练数据集,该训练数据集包括多个训练图像;进一步地,根据该训练数据集进行配准学习和超像素分割学习,得到分割模型的初始模型参数;并基于该初始模型参数训练分割模型。本申请能够提升分割模型在分割任务中的边缘感知力,从而提升该分割模型的分割效果。
-
公开(公告)号:CN117827418A
公开(公告)日:2024-04-05
申请号:CN202211194263.1
申请日:2022-09-28
Applicant: 华为云计算技术有限公司
Abstract: 本公开涉及一种神经网络模型的数据处理方法、装置、系统、介质以及程序产品,神经网络模型包括P个专家模块并且部署于多个节点中,其中第一节点包括第一计算单元,第一计算单元包括神经网络模型中的Q个专家模块,其中Q≤P,该方法包括:第一计算单元获取待处理数据,其中待处理数据包括Q个专家模块的输入数据;将待处理数据分别发送给第一处理资源和第二处理资源;第一处理资源对待处理数据进行切分,得到由第一处理资源上的专家模块进行处理的数据;以及第二处理资源对待处理数据进行切分,得到由第二处理资源上的专家模块进行处理的数据。根据本公开的实施例的数据处理方案,显著减少了处理资源或混合专家系统中数据分发和收集的通信开销和参数冗余,提高了处理效率。
-
-
-
-
-