-
公开(公告)号:CN117171554A
公开(公告)日:2023-12-05
申请号:CN202210571345.7
申请日:2022-05-24
Applicant: 华为云计算技术有限公司
IPC: G06F18/214 , G06N3/0455 , G06N3/088 , G06N3/096 , G06F40/242 , G06F40/216
Abstract: 本申请提供了一种模型训练方法,包括:获取第一基础模型的特征向量层参数,以及获取对齐矩阵,该第一基础模型为利用第一训练集预训练好的基础模型,然后根据第一基础模型的特征向量层参数和对齐矩阵,对第二基础模型的特征向量层参数进行初始化,接着利用第二训练集训练初始化后的第二基础模型。该方法通过对齐矩阵将第一基础模型的特征向量层参数迁移学习至第二基础模型的特征向量层进行初始化,由此可以加快训练进度,提高训练效率,提升训练效果。
-
公开(公告)号:CN116187414A
公开(公告)日:2023-05-30
申请号:CN202111425818.4
申请日:2021-11-26
Applicant: 华为云计算技术有限公司
Abstract: 本申请提供了一种神经网络模型加解密方法,应用于人工智能(AI)技术领域,包括:获取神经网络模型的结构信息和加密密钥,加密密钥用于指示待添加至神经网络模型的至少一个第二神经元的添加方式,然后根据神经网络模型的结构信息和加密密钥,向神经网络模型添加至少一个第二神经元,获得加密后的神经网络模型。当加密后的神经网络模型被交付给用户时,可以根据加密密钥,将加密后的神经网络模型中第二神经元的权重置零,从而实现模型解密。该方法通过在模型中添加具有混淆作用的第二神经元,使得模型的真实结构得到充分隐藏,实现了模型加密,然后在解密时,将第二神经元的权重置零,实现了模型解密,并且不泄露模型的真实结构和权重,保障了解密安全。
-
公开(公告)号:CN118350380A
公开(公告)日:2024-07-16
申请号:CN202310028655.9
申请日:2023-01-09
Applicant: 华为云计算技术有限公司 , 中国科学技术大学
IPC: G06F40/35 , G06F40/45 , G06V40/20 , G06N3/0455 , G06N3/08
Abstract: 本申请涉及人工智能技术领域,尤其涉及一种手语视频的翻译方法及装置,所述方法包括:获取与第一手语视频匹配的至少一个第一参考句子,所述第一手语视频为待翻译的手语视频,所述第一参考句子表示能够为所述第一手语视频的翻译提供语义参考的自然语言句子;从所述第一手语视频和所述至少一个第一参考句子中,分别提取第一视觉特征序列和第一文本特征序列;根据所述第一视觉特征序列和所述第一文本特征序列生成所述第一手语视频对应的第一翻译文本。本申请实施例提供的手语视频的翻译方法及装置,能够提升手语视频的翻译的准确性。
-
公开(公告)号:CN117217292A
公开(公告)日:2023-12-12
申请号:CN202210604357.5
申请日:2022-05-30
Applicant: 华为云计算技术有限公司
IPC: G06N3/096 , G06N3/0895 , G06F18/214 , G06F18/23
Abstract: 一种模型训练方法及装置,该方法中,训练设备从AI平台的提示参数池中选择第一提示参数集合;基于第一提示参数集合,得到初始化后的任务模型,任务模型包括提示层和基础模型,其中,第一提示参数集合用于初始化提示层,基础模型是部署于所述AI平台中的预训练的AI模型;基于训练数据集训练所述初始化后的任务模型,得到训练后的任务模型。在使用第一提示参数集合初始化后的任务模型的基础上进行训练,可以提高训练效率,节省算力开销。
-
公开(公告)号:CN118052199A
公开(公告)日:2024-05-17
申请号:CN202211397731.5
申请日:2022-11-09
Applicant: 华为云计算技术有限公司 , 中国科学技术大学
IPC: G06F40/126 , G06F40/279
Abstract: 一种基于Transformer的编码方法,包括:获取第一文本的第一向量表示,通过n个串联的第一编码器对第一向量表示进行处理,得到第一编码结果;获取第二文本的第二向量表示,通过m个串联的第二编码器对第二向量表示进行处理,得到第二编码结果,在通过m个第二编码器中第i个第二编码器对第(i‑1)个第二编码器输出的结果处理时,通过n个第一编码器中第(i‑1)个第一编码器的输出结果进行辅助处理;对第一编码结果和第二编码结果进行拼接;通过g个串联的第三编码器对拼接得到的结果处理,输出处理结果。这样,对不同文本单独编码,并通过利用对第一文本编码的中间结果对第二文本进行辅助编码,扩大了第二文本低层的注意力范围,提升了编码结果的准确性。
-
公开(公告)号:CN116796760A
公开(公告)日:2023-09-22
申请号:CN202210244066.X
申请日:2022-03-11
Applicant: 华为云计算技术有限公司
IPC: G06F40/58 , G06F40/205 , G06F40/30 , G06F18/214 , G06F40/189
Abstract: 本申请提供一种翻译系统及其训练、应用方法与相关设备,该翻译系统包括第一语言模型和第二语言模型,第一语言模型包括第一编码器、第一对齐编码器、第一对齐解码器和第一解码器,第二语言模型包括第二编码器、第二对齐编码器、第二对齐解码器和第二解码器,通过平行语料对所述第一语言模型和所述第二语言模型进行训练,得到训练好的所述第一语言模型和所述第二语言模型;通过对训练好的第一语言模型和第二语言模型中的编码器和解码器进行组合,即可实现第一语言和第二语言之间的相互翻译。通过使用本申请提供的翻译系统,能够提高翻译系统的训练效率,节约计算资源,并能够提高翻译系统的可扩展性。
-
公开(公告)号:CN116563660A
公开(公告)日:2023-08-08
申请号:CN202210109103.6
申请日:2022-01-28
Applicant: 华为云计算技术有限公司
IPC: G06V10/774 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/044 , G06N3/045 , G06N3/096
Abstract: 本申请公开了一种基于预训练大模型的图像处理方法及相关装置,通过生成网络获取训练图像的特征图像,特征图像的分辨率与训练图像的分辨率相同;将训练图像和特征图像进行融合,得到目标图像;将目标图像输入到预训练大模型中,得到处理结果;根据处理结果,在保持预训练大模型的参数不变的情况下,对生成网络的参数进行更新。本申请中,针对每个下游任务配置了生成网络,在训练过程中,在保持预训练大模型的参数不变的情况下,对生成网络的参数进行更新,从而减少了在下游任务上部署预训练大模型时的训练开销,减少了模型训练难度与迭代更新的难度。
-
公开(公告)号:CN116486390A
公开(公告)日:2023-07-25
申请号:CN202210042465.8
申请日:2022-01-14
Applicant: 华为云计算技术有限公司
IPC: G06V20/62 , G06V10/764 , G06V10/75
Abstract: 本申请实施例公开了一种搜索方法以及装置,可以适用于任何一种与搜索相关的场景中。其中,方法包括获取待搜索对象,并利用目标模型对待搜索对象进行特征提取,以获取多个目标特征向量,多个目标特征向量包括第一目标特征向量和第二目标特征向量,其中,第一目标特征向量的维度低于第二目标特征向量的维度。先根据第一目标特征向量,从多个候选对象中筛选出第一候选对象,再根据第二目标特征向量,从第一候选对象中筛选出第二候选对象,最后根据第二候选对象获取与待搜索对象匹配的候选对象。通过本方案,可以提升搜索的效率,为用户提供更好的搜索服务体验。
-
公开(公告)号:CN118819695A
公开(公告)日:2024-10-22
申请号:CN202310429346.2
申请日:2023-04-20
Applicant: 华为云计算技术有限公司 , 中国科学技术大学
Abstract: 本申请公开了一种提示学习方法,该方法中,获取至少一组数据对,任意一组数据对包括第一数据和第二数据,第一数据包括第一提示和采用源语言的第一语料,第二数据包括第二提示和采用目标语言的第二语料,第一语料和第二语料组成一对平行语料;根据至少一组数据对以及预训练语言模型进行提示学习,以使得训练后的预训练语言模型能够根据训练后的第二提示执行基于目标语言的自然语言处理任务。这样,在提示学习过程中,预训练语言模型和/或第二提示等参数可以根据由平行语料所构建的数据对而调整,以使得训练后的预训练语言模型和/或训练后的第二提示能够对齐源语言和目标语言,缓解了跨语言迁移过程中由于语言表征差异性所带来的性能损失。
-
公开(公告)号:CN116756300A
公开(公告)日:2023-09-15
申请号:CN202310559306.X
申请日:2023-05-17
Applicant: 深圳华为云计算技术有限公司
IPC: G06F16/335 , G06F16/338 , G06F16/33 , G06F40/289 , G06F40/216 , G06N3/08
Abstract: 本申请提供了一种检索方法、系统及相关设备,该方法可包括以下步骤:获取用户输入的查询文本,然后获取多个与查询文本之间的文本相关度较高的多个候选文书,然后确定每个候选文书与查询文本之间的法律相关度,并对多个候选文书进行排序获得排序结果,将其显示给用户,该系统先按照文本相关度筛选出多个候选文书,再按照法律相关度对多个候选文书进行排序,从而避免用户获得文本相同而非相关案例这一问题的出现,提高检索精度,提高用户的使用体验。
-
-
-
-
-
-
-
-
-