-
公开(公告)号:CN119537040B
公开(公告)日:2025-05-23
申请号:CN202510103643.7
申请日:2025-01-22
Applicant: 深圳华为云计算技术有限公司
Abstract: 本申请公开了一种运行在云计算平台上的任务处理方法、装置及设备,涉及云计算技术领域。云计算平台可以根据任务类型和业务容器组的任务处理性动态调整待推理任务的调度策略,能够避免相关板卡的硬件资源被长时间占用。在节省硬件资源的同时提升任务处理的灵活性。该方法包括:获取待推理任务的任务信息以及业务容器组的能力信息;根据待推理任务的任务类型以及多个调度策略中每个调度策略对应的业务容器组的能力信息从该多个调度策略中确定目标调度策略,该每个调度策略用于指示调度该每个调度策略对应的业务容器组处理该每个调度策略对应的推理任务;调度该目标调度策略对应的业务容器组处理该待推理任务。
-
公开(公告)号:CN119537040A
公开(公告)日:2025-02-28
申请号:CN202510103643.7
申请日:2025-01-22
Applicant: 深圳华为云计算技术有限公司
Abstract: 本申请公开了一种运行在云计算平台上的任务处理方法、装置及设备,涉及云计算技术领域。云计算平台可以根据任务类型和业务容器组的任务处理性动态调整待推理任务的调度策略,能够避免相关板卡的硬件资源被长时间占用。在节省硬件资源的同时提升任务处理的灵活性。该方法包括:获取待推理任务的任务信息以及业务容器组的能力信息;根据待推理任务的任务类型以及多个调度策略中每个调度策略对应的业务容器组的能力信息从该多个调度策略中确定目标调度策略,该每个调度策略用于指示调度该每个调度策略对应的业务容器组处理该每个调度策略对应的推理任务;调度该目标调度策略对应的业务容器组处理该待推理任务。
-
公开(公告)号:CN120012835A
公开(公告)日:2025-05-16
申请号:CN202510492694.3
申请日:2025-04-18
Applicant: 深圳华为云计算技术有限公司
IPC: G06N3/0455 , G06N3/096 , G06N5/04
Abstract: 本申请实施例公开了一种模型训练方法,该方法中,可以根据第一模型中的预设注意力模块的模型参数与第二模型中的MLA模块中的模型参数的相关性,将预设注意力模块中的模型权重变换为MLA模块的初始化的模型权重,以将预设注意力模块中的知识迁移至初始化后的MLA模块中,为初始化后的第二模型提供较好的知识基础,然后对MLA模块进行微调等小规模的训练即可获得性能较好的训练后的第二模型,而无需对第二模型从零开始执行完整的全流程训练过程,大大提升对第二模型的训练效率。
-
-