一种模型权重获取方法以及相关系统

    公开(公告)号:CN116090538A

    公开(公告)日:2023-05-09

    申请号:CN202111307019.7

    申请日:2021-11-05

    Abstract: 本申请提供了一种模型权重获取方法,包括:获取第一神经网络模型的结构信息,根据第一神经网络模型的结构信息,从存储有多组历史权重的权重库中搜索获得参考权重,参考权重为多组历史权重中与第一神经网络模型的结构相似的第二神经网络模型的权重,对参考权重进行转换,获得第一神经网络模型的权重。该方法通过搜索权重库中与待训练的神经网络模型的结构相似的神经网络模型的权重,并对该权重进行转换,从而获得待训练的神经网络模型可用的权重,无需从头开始进行模型训练,提高了模型训练效率。

    一种运行在云计算平台上的任务处理方法、装置及设备

    公开(公告)号:CN119537040A

    公开(公告)日:2025-02-28

    申请号:CN202510103643.7

    申请日:2025-01-22

    Abstract: 本申请公开了一种运行在云计算平台上的任务处理方法、装置及设备,涉及云计算技术领域。云计算平台可以根据任务类型和业务容器组的任务处理性动态调整待推理任务的调度策略,能够避免相关板卡的硬件资源被长时间占用。在节省硬件资源的同时提升任务处理的灵活性。该方法包括:获取待推理任务的任务信息以及业务容器组的能力信息;根据待推理任务的任务类型以及多个调度策略中每个调度策略对应的业务容器组的能力信息从该多个调度策略中确定目标调度策略,该每个调度策略用于指示调度该每个调度策略对应的业务容器组处理该每个调度策略对应的推理任务;调度该目标调度策略对应的业务容器组处理该待推理任务。

    一种运行在云计算平台上的任务处理方法、装置及设备

    公开(公告)号:CN119537040B

    公开(公告)日:2025-05-23

    申请号:CN202510103643.7

    申请日:2025-01-22

    Abstract: 本申请公开了一种运行在云计算平台上的任务处理方法、装置及设备,涉及云计算技术领域。云计算平台可以根据任务类型和业务容器组的任务处理性动态调整待推理任务的调度策略,能够避免相关板卡的硬件资源被长时间占用。在节省硬件资源的同时提升任务处理的灵活性。该方法包括:获取待推理任务的任务信息以及业务容器组的能力信息;根据待推理任务的任务类型以及多个调度策略中每个调度策略对应的业务容器组的能力信息从该多个调度策略中确定目标调度策略,该每个调度策略用于指示调度该每个调度策略对应的业务容器组处理该每个调度策略对应的推理任务;调度该目标调度策略对应的业务容器组处理该待推理任务。

    流量调度方法和装置
    4.
    发明公开

    公开(公告)号:CN118233462A

    公开(公告)日:2024-06-21

    申请号:CN202211597204.9

    申请日:2022-12-12

    Abstract: 本申请提供了一种流量调度方法、装置、计算设备、计算设备集群、计算机程序产品以及计算机可读存储介质,涉及云技术领域。其中,该方法应用于云管理平台,该方法接收针对微服务的访问请求,根据该访问请求确定对应的服务器组,将该服务器组中的多个服务器划分成至少一个服务器子组,采用第一调度策略从该服务器组中确定服务器子组,采用第二调度策略从该服务器子组中确定服务器,将该访问请求转发至该服务器。通过逻辑分组,管理员可以基于第一调度策略批量地调整各服务器子组流量权重,提高了调整流量调度策略的效率,从而提高了微服务的运维效率。

Patent Agency Ranking