-
公开(公告)号:CN118152794A
公开(公告)日:2024-06-07
申请号:CN202211507521.7
申请日:2022-11-29
Applicant: 华为云计算技术有限公司 , 香港理工大学
IPC: G06F18/214
Abstract: 本申请提供了一种模型更新方法,用于提高调整人工智能模型的效率。其中,模型更新方法包括:获取第一数据集;根据所述第一数据集调整目标模型的参数中的目标参数,得到更新后的目标模型,所述目标模型的参数中还包括非目标参数;其中,调整所述目标参数对所述目标模型的精度的影响程度,大于调整所述非目标参数对所述目标模型的精度的影响程度。另外,本申请还提供了对应的装置、计算设备集群、芯片、计算机可读存储介质以及计算机程序产品。
-
公开(公告)号:CN118863086A
公开(公告)日:2024-10-29
申请号:CN202310601191.6
申请日:2023-05-25
Applicant: 华为云计算技术有限公司
Abstract: 本申请提供了一种获取模型的方法和计算设备,由于通过性能矩阵可以确定各个模型在各个测试数据集下的性能。因此,后续针对不同用户提供的目标数据可以根据目标数据和目标性能矩阵,输出该目标数据对应的推荐矩阵,即,获得用户所关注的目标评价指标下的各个模型的性能。本申请的方案可以快速的为用户输出推荐矩阵,以便确定出与目标数据适配的目标模型,可以减少计算资源的占用以及提高模型获取的效率。
-
公开(公告)号:CN117668741A
公开(公告)日:2024-03-08
申请号:CN202210959694.6
申请日:2022-08-11
Applicant: 华为云计算技术有限公司
Abstract: 本申请提供了一种模型训练方法、装置及计算机存储介质。在实施例中,该方法包括:确定业务对象;基于业务对象的第一结构化数据构建的第一样本集,确定算法池中的各算法各自对应的评估结果;基于算法池中的各算法各自的评估结果,从算法池中选择N个基算法和对应的超参数组合,构建多个基模型;基于第一样本集和多个基模型,训练预先设置的图网络模型;其中,图网络模型用于基于学习到的多个基模型针对所述业务对象之间的关系,融合多个基模型各自的第一预测结果,输出融合后的第二预测结果;基于多个基模型和训练好的图网络模型实现业务对象的预测,通过学习多个基模型之间的关系,对多个基模型各自的预测结果进行融合,确保预测结果的准确性。
-
公开(公告)号:CN118734062A
公开(公告)日:2024-10-01
申请号:CN202310737934.2
申请日:2023-06-20
Applicant: 华为云计算技术有限公司
IPC: G06F18/214 , G06F18/22 , G06N20/00
Abstract: 本申请提供了一种动作生成方法,该方法应用于动作生成系统,该系统用于根据文本生成与文本对应的动作,该方法包括:接收用户输入的目标文本;根据目标文本,确定与目标文本对应的提示信息,其中,提示信息包括至少一个姿态;将提示信息输入基于提示学习训练的动作生成模型,获得目标文本对应的目标动作,其中,目标动作包括与目标文本对应的多个姿态形成的姿态序列。该方法针对不同的任务需求,不需要重新训练或微调动作生成模型,具有较强的可控性和灵活性。由于部署阶段无需针对给定的文本进行在线的匹配和网络训练,节省了计算资源,降低了时间开销。而且,该方法能够不受限于特定的数据集,保障了生成的动作的多样性。
-
公开(公告)号:CN118334325A
公开(公告)日:2024-07-12
申请号:CN202211711174.X
申请日:2022-12-29
Applicant: 华为云计算技术有限公司 , 香港理工大学
IPC: G06V10/26 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/08
Abstract: 一种数据处理方法及装置,该方法包括,第一设备获取第一数据,将第一数据输入训练后的任务模型,以得到任务模型输出的处理结果;任务模型包括预训练模型和至少一个提示模块,预训练模型被划分为多个模块,多个模块中每相邻两个模块与所述至少一个提示模块中的一个提示模块相对应;多个模块中排在起始位置的第一模块的输入数据包括第一数据,多个模块中排在第一模块之后的任意一个第二模块的输入数据是根据第二模块的前一个模块输出的处理结果和目标提示模块输出的修正因子确定的。该方法在不改变预训练模型的结构的基础上,利用修正因子更好地激发预训练模型迁移预训练知识来进行像素级别的语义标注,从而提高任务处理精度。
-
公开(公告)号:CN117876838A
公开(公告)日:2024-04-12
申请号:CN202211211337.8
申请日:2022-09-30
Applicant: 华为云计算技术有限公司
IPC: G06V10/82 , G06V10/80 , G06N3/0464 , G06N3/045 , G06N3/08
Abstract: 一种图像处理方法,包括:通过主干网络的前N个卷积层处理目标图像,获得浅层特征;根据浅层特征对目标图像中的业务对象进行强化处理,获得优化图像;通过主干网络处理优化图像,获得语义特征,该语义特征用于预测目标图像所属的子类或检索与目标图像属于相同子类的图像。由此,根据目标图像的浅层特征对目标图像中的业务对象进行强化处理,使得目标图像中有利于对目标图像执行细粒度图像处理任务的业务对象在优化图像中的特征更为显著,对主干网络可以起到提示作用,主干网络处理优化图像以得到的语义特征能够更加专注于业务对象的特征,进而可以根据目标图像的语义特征更加准确的预测目标图像所属的子类或检索与目标图像属于相同子类的图像。
-
公开(公告)号:CN117828323A
公开(公告)日:2024-04-05
申请号:CN202211193322.3
申请日:2022-09-28
Applicant: 华为云计算技术有限公司
IPC: G06F18/213 , G06N20/00
Abstract: 本申请涉及一种特征预测方法、装置和存储介质。该方法包括:获取待预测对象的历史数据以及预测单位时间,历史数据包括:待预测对象的类别特征以及类别特征对应的历史序列特征,历史序列特征表示针对类别特征的待预测对象在多个历史单位时间下采集的历史行为数据;根据历史数据以及预测单位时间进行特征预测,得到目标序列特征,目标特征序列表示类别特征的待预测对象在预测单位时间内的预测行为数据。根据本申请实施例,能够提高特征预测的便捷性和效率。
-
公开(公告)号:CN116563660A
公开(公告)日:2023-08-08
申请号:CN202210109103.6
申请日:2022-01-28
Applicant: 华为云计算技术有限公司
IPC: G06V10/774 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/044 , G06N3/045 , G06N3/096
Abstract: 本申请公开了一种基于预训练大模型的图像处理方法及相关装置,通过生成网络获取训练图像的特征图像,特征图像的分辨率与训练图像的分辨率相同;将训练图像和特征图像进行融合,得到目标图像;将目标图像输入到预训练大模型中,得到处理结果;根据处理结果,在保持预训练大模型的参数不变的情况下,对生成网络的参数进行更新。本申请中,针对每个下游任务配置了生成网络,在训练过程中,在保持预训练大模型的参数不变的情况下,对生成网络的参数进行更新,从而减少了在下游任务上部署预训练大模型时的训练开销,减少了模型训练难度与迭代更新的难度。
-
-
-
-
-
-
-