基于云边环境的微服务优化部署控制方法、系统及集群

    公开(公告)号:CN113064712B

    公开(公告)日:2022-05-17

    申请号:CN202110412428.7

    申请日:2021-04-16

    Abstract: 本发明提供一种基于云边环境的微服务优化部署控制方法、系统及集群,所述基于云边环境的微服务优化部署控制方法包括:包括:将微服务应用划分成为多个子结构并将每个子结构映射到云边连续体的同一节点中;基于优化目标的约束为每个微服务细粒度的分配计算资源;监测每个节点的资源使用情况,在运行时发现资源使用不均衡时,将微服务从拥塞节点迁移至其他空闲节点。本发明可以解决微服务在云边连续体环境下的部署问题,以在保证用户请求端到端延迟要求的情况下最小化微服务的资源使用。

    面向多阶段AI云服务的高吞吐异构资源管理方法及器件

    公开(公告)号:CN114035935B

    公开(公告)日:2024-07-19

    申请号:CN202111193853.8

    申请日:2021-10-13

    Abstract: 本发明提供一种面向多阶段AI云服务的高吞吐异构资源管理方法及器件,所述面向多阶段AI云服务的高吞吐异构资源管理方法包括:利用一服务质量目标分配器基于接收到的LC服务的请求将服务质量目标拆分为CPU侧服务质量目标和GPU侧服务质量目标;利用一异构资源管理器以CPU侧服务质量目标和GPU侧服务质量目标作为初始样本搜索最佳资源分配;利用一服务质量补偿器实时监测CPU阶段的进度,并在用户请求在CPU阶段花费的时间超过其CPU的服务质量目标时,加速其在加速器端的执行。本发明既保证LC服务的服务质量,又极大地提高了异构设备上所有BE应用的综合性能。

    基于云边环境的微服务优化部署控制方法、系统及集群

    公开(公告)号:CN113064712A

    公开(公告)日:2021-07-02

    申请号:CN202110412428.7

    申请日:2021-04-16

    Abstract: 本发明提供一种基于云边环境的微服务优化部署控制方法、系统及集群,所述基于云边环境的微服务优化部署控制方法包括:包括:将微服务应用划分成为多个子结构并将每个子结构映射到云边连续体的同一节点中;基于优化目标的约束为每个微服务细粒度的分配计算资源;监测每个节点的资源使用情况,在运行时发现资源使用不均衡时,将微服务从拥塞节点迁移至其他空闲节点。本发明可以解决微服务在云边连续体环境下的部署问题,以在保证用户请求端到端延迟要求的情况下最小化微服务的资源使用。

    面向多阶段AI云服务的高吞吐异构资源管理方法及器件

    公开(公告)号:CN114035935A

    公开(公告)日:2022-02-11

    申请号:CN202111193853.8

    申请日:2021-10-13

    Abstract: 本发明提供一种面向多阶段AI云服务的高吞吐异构资源管理方法及器件,所述面向多阶段AI云服务的高吞吐异构资源管理方法包括:利用一服务质量目标分配器基于接收到的LC服务的请求将服务质量目标拆分为CPU侧服务质量目标和GPU侧服务质量目标;利用一异构资源管理器以CPU侧服务质量目标和GPU侧服务质量目标作为初始样本搜索最佳资源分配;利用一服务质量补偿器实时监测CPU阶段的进度,并在用户请求在CPU阶段花费的时间超过其CPU的服务质量目标时,加速其在加速器端的执行。本发明既保证LC服务的服务质量,又极大地提高了异构设备上所有BE应用的综合性能。

Patent Agency Ranking