一种模型训练方法、图像处理方法及相关装置

    公开(公告)号:CN117437440A

    公开(公告)日:2024-01-23

    申请号:CN202210801213.9

    申请日:2022-07-08

    Abstract: 一种模型训练方法,应用于人工智能领域,能够提高模型的领域泛化能力。该方法中,模型在训练过程中基于输入图像的特征统计信息和其他域的图像的特征统计信息来预测输入图像所在域的特征统计信息,进而基于输入图像所在域的特征统计信息对输入图像进行处理。由于模型在预测特征统计信息的过程中,既考虑了输入图像与其他域的图像之间的共性,还结合了输入图像本身的特征分布独特性,因此模型能够有效地预测得到输入图像所在域的特征分布信息。这样一来,在模型学会预测输入图像所在域的特征分布的基础上,能够基于输入图像所在域的特征分布对输入图像进行处理,有效地提高了模型的领域泛化能力。

    一种翻译系统及其训练、应用方法以及相关设备

    公开(公告)号:CN116796760A

    公开(公告)日:2023-09-22

    申请号:CN202210244066.X

    申请日:2022-03-11

    Abstract: 本申请提供一种翻译系统及其训练、应用方法与相关设备,该翻译系统包括第一语言模型和第二语言模型,第一语言模型包括第一编码器、第一对齐编码器、第一对齐解码器和第一解码器,第二语言模型包括第二编码器、第二对齐编码器、第二对齐解码器和第二解码器,通过平行语料对所述第一语言模型和所述第二语言模型进行训练,得到训练好的所述第一语言模型和所述第二语言模型;通过对训练好的第一语言模型和第二语言模型中的编码器和解码器进行组合,即可实现第一语言和第二语言之间的相互翻译。通过使用本申请提供的翻译系统,能够提高翻译系统的训练效率,节约计算资源,并能够提高翻译系统的可扩展性。

    训练神经网络模型的方法、数据处理的方法及装置

    公开(公告)号:CN112561028B

    公开(公告)日:2024-10-22

    申请号:CN201910914033.X

    申请日:2019-09-25

    Abstract: 本申请属于人工智能领域的计算机视觉领域。本申请提供了一种训练神经网络模型的方法,包括:获取多个构建单元以及待训练数据;堆叠多个构建单元得到初始神经网络模型,初始神经网络模型的参数包括结构参数以及权重参数;将待训练数据输入初始神经网络模型,并根据第一损失函数对权重参数求二阶梯度得到的梯度值,对结构参数进行更新,以得到满足预设要求、用于识别多媒体数据的神经网络模型,第一损失函数用于对权重参数更新。本申请提供一种训练神经网络模型的方法、数据处理的方法及设备,目的在于提供一种精确识别多媒体数据的方法。

    数据处理方法、装置、系统、介质以及程序产品

    公开(公告)号:CN117827418A

    公开(公告)日:2024-04-05

    申请号:CN202211194263.1

    申请日:2022-09-28

    Abstract: 本公开涉及一种神经网络模型的数据处理方法、装置、系统、介质以及程序产品,神经网络模型包括P个专家模块并且部署于多个节点中,其中第一节点包括第一计算单元,第一计算单元包括神经网络模型中的Q个专家模块,其中Q≤P,该方法包括:第一计算单元获取待处理数据,其中待处理数据包括Q个专家模块的输入数据;将待处理数据分别发送给第一处理资源和第二处理资源;第一处理资源对待处理数据进行切分,得到由第一处理资源上的专家模块进行处理的数据;以及第二处理资源对待处理数据进行切分,得到由第二处理资源上的专家模块进行处理的数据。根据本公开的实施例的数据处理方案,显著减少了处理资源或混合专家系统中数据分发和收集的通信开销和参数冗余,提高了处理效率。

Patent Agency Ranking