GPU集群调度策略模拟方法及GPU集群模拟器

    公开(公告)号:CN113504966B

    公开(公告)日:2023-10-31

    申请号:CN202110690973.2

    申请日:2021-06-22

    Abstract: 本发明提出一种GPU集群调度策略模拟方法,包括:获取模拟GPU集群的集群参数、拟执行的工作负载及对应的调度策略;基于该调度策略,获取该工作负载完成无故障运行的预测时间;根据该集群参数和该预测时间,设定该模拟GPU集群的模拟故障参数;以该调度策略及该模拟故障参数进行该工作负载的故障工作模拟,获取该工作负载在故障工作状态时的运行数据。本发明还提出一种GPU集群模拟器,及一种实现GPU集群调度策略模拟数据处理装置。

    一种面向链路资源的自适应互连与路由控制方法和系统

    公开(公告)号:CN109842553B

    公开(公告)日:2021-10-08

    申请号:CN201711320765.3

    申请日:2017-12-12

    Abstract: 本发明涉及一种面向直接网络快速通路链路资源的自适应互连与路由控制系统,包括高维交换机互连模块、路由信息生成模块、路由表生成模块,以及高维交换机之间的互连方法和相应的无死锁路由方法。高维交换机互连模块会根据快速通路的链路资源数量,对其中的节点进行分组,设置通讯节点,并记录分组信息,然后将高维交换机的通讯节点使用快速链路进行互连。路由信息生成模块通过映射表存储高维交换机通讯节点的快速通路连接关系。路由表生成模块根据分组信息和映射表生成路由转发表和虚通道切换表,实现无死锁路由功能。

    一种基于全局链路负载均衡的网络链路控制方法和系统

    公开(公告)号:CN108965153B

    公开(公告)日:2020-10-13

    申请号:CN201810700002.X

    申请日:2018-06-29

    Abstract: 本发明涉及一种基于全局链路负载均衡的网络链路控制方法和系统,包括:根据计算网络中所有作业的计算资源部署位置,按照分组内计算资源部署位置连续的原则划分同一作业的计算资源,得到多个分组,根据作业的通信特征,统计分组间发生通信的单位时间通信量总和,根据该单位时间通信量总和,在多个分组中筛选互连备选项;统计各个互连备选项连接后,网络中每条网络链路作为网络中所有路由路径次数,作为互连备选项间的网络负载均衡指数,将该网络负载均衡指数最大时对应的互连备选项进行互连。

    一种面向多轨网络的光路交换方法和系统

    公开(公告)号:CN109257663B

    公开(公告)日:2020-07-17

    申请号:CN201810972682.0

    申请日:2018-08-24

    Abstract: 本发明涉及一种面向多轨网络的光路交换方法和系统,包括:获取多个中继光路交换机、多个终端光路交换机和待光路通信的多个多轨服务器节点,终端光路交换机的总数为m;将多轨服务器节点的电交换节点作为终端,每个多轨服务器节点具有由k个终端构成的终端组,每个终端交换机通过其具有的N个终端互连端口与n个终端组相连;得到中继光路交换机的总数通过将m个终端光路交换机的个中继互连端口与个中继光路交换机m个中继互连端口进行互连,得到光路单轨互连系统;依次检查两终端互连端口间是否具有空闲的固定链路,以得到光路多轨互连系统;任意两终端间通过光路多轨互连系统进行光路交换,以完成光路通信。

    具有业务快速恢复功能的容器组更新方法及系统

    公开(公告)号:CN111290767A

    公开(公告)日:2020-06-16

    申请号:CN202010063953.8

    申请日:2020-01-20

    Abstract: 本发明提出一种具有业务快速恢复功能的容器组更新方法及系统,包括:根据对容器组的更新请求,暂停该容器组的服务,通过比较更新请求和容器组当前状态,确定该容器组中待更新容器,并将该容器组中除该待更新容器以外的容器全都暂停,并将除该待更新容器以外的容器的进程持久化到磁盘;保存该待更新容器的运行状态,根据该更新请求中需要更新的容器镜像文件构建新的容器镜像,销毁该待更新容器后根据该运行状态重新运行新的容器镜像,得到更新容器,恢复运行该容器组以完成对该容器组的更新。

    一种包含跨维度链路的直接网络路由方法和系统

    公开(公告)号:CN107094116B

    公开(公告)日:2020-02-28

    申请号:CN201710385210.0

    申请日:2017-05-26

    Abstract: 本发明涉及一种包含跨维度链路的直接网络路由方法和系统,包括:对直接网络中的跨维度链路进行两两配对分组,生成多个分组,将设置完成后的多个该分组集合为分组信息;为该分组信息中相应分组设置维度,并根据分组中跨维度链路的方向和该维度,为每条设置跨维度链路两端节点的坐标和方向信息;根据该坐标和方向信息,生成该直接网络中各节点到其他节点的端口转发表,该直接网络中各节点根据该端口转发表对相应数据进行转发。由此本发明具有对应用场景强适应性、路由交换无死锁特性、通过LFT表示路由算法结果、低数据依赖性特征以及大规模可扩展性强等技术效果。

    多租户任务调度方法、系统
    30.
    发明公开

    公开(公告)号:CN116501459A

    公开(公告)日:2023-07-28

    申请号:CN202310286432.2

    申请日:2023-03-22

    Abstract: 本发明提出一种多租户任务调度方法、系统,所述方法包括:依据用户任务请求,为深度神经网络的每个层生成满足QoS要求的候选层集合;为候选层集合中的每个候选层设置一个标识符,重构深度神经网络模型;在GPU中执行深度神经网络模型的情况下,计算不同的候选层组合的共置开销,生成共置开销集合,选择具有最佳共置性能的至少一组候选层组合作为最优候选实现;在GPU中不执行深度神经网络模型的情况下,选择候选层集合中的最优候选层作为最优候选实现;将最优候选实现作为标识符列表,写入用户任务请求并提交至GPU;GPU运行时根据所述标识符列表选择对应的候选层实现。该方法在保证每个作业的QoS的同时,提高多租户系统的吞吐量。

Patent Agency Ranking