基于异构分布式集群的多任务调度方法和装置

    公开(公告)号:CN118227291B

    公开(公告)日:2025-04-22

    申请号:CN202410377580.X

    申请日:2024-03-29

    Applicant: 清华大学

    Abstract: 本发明提供了一种基于异构分布式集群的多任务调度方法和装置,涉及多任务处理技术领域,方法包括:对待处理任务队列中的任务进行分析获得对应的任务描述信息,任务描述信息包括任务种类、优先级、截止时间和任务所需资源类型及数量;将任务描述信息记录在池化层的任务管理表中;基于池化层的资源管理表中记录的集群资源数据进行资源利用评估获得资源评估结果;调度层基于资源评估结果和任务管理表中的任务描述信息为每个任务的执行分配相应的硬件资源。本发明能够将任务分配给最适合的资源执行,从而缩短任务的完成时间和减少等待时间,还能够实时监控资源使用情况和负载状态,动态调整资源分配和任务调度策略,以应对工作负载的变化。

    路由路径确定的方法、装置、电子设备及存储介质

    公开(公告)号:CN118200227B

    公开(公告)日:2025-05-13

    申请号:CN202410471012.6

    申请日:2024-04-18

    Applicant: 清华大学

    Abstract: 本申请涉及路由技术领域,具体提供了一种路由路径确定的方法、装置、电子设备及存储介质。一种路由路径确定的方法,包括获取源端口及其所属的源节点以及目的端口及其所属的目的节点;根据蜻蜓网络结构,源节点以及目的节点,生成源节点和目的节点之间的节点间路由路径;根据蜻蜓网络结构,源端口及其所属的源节点以及目的端口及其所属的目的节点,确定节点间路由路径中各路由节点分别对应的输入输出端口;根据节点间路由路径中各路由节点分别对应的输入输出端口和节点内网络结构,分别生成每一路由节点的节点内路由路径;根据节点间路由路径以及各节点内路由路径,获得源端口与目的端口之间的目标路由路径。这样,可以提高路由转发的效率。

    一种计算集群联合仿真器同步处理方法、装置及系统

    公开(公告)号:CN118227261B

    公开(公告)日:2025-01-07

    申请号:CN202410321008.1

    申请日:2024-03-20

    Applicant: 清华大学

    Abstract: 本公开涉及仿真技术领域,尤其涉及一种计算集群联合仿真器同步处理方法、装置及系统。所述方法包括:计算集群多个仿真器获取同步周期,同步周期用于统一计算集群多个仿真器在时间尺度上的仿真时间;在每个同步周期内,计算集群多个仿真器独立执行各自的仿真任务;在每个同步周期结束时,计算集群多个仿真器之间交换各自的同步数据,同步数据用于指示仿真任务的执行情况。本公开实施例提供的计算集群联合仿真器同步处理方法通过在同步周期结束时交换同步数据,可以确保各仿真器在相同时间点进行同步,提高了仿真的同步精度,保证了仿真结果的准确性。

    一种大规模异构类脑集群软件栈融合方法和系统

    公开(公告)号:CN118519765B

    公开(公告)日:2024-12-10

    申请号:CN202410585997.5

    申请日:2024-05-11

    Applicant: 清华大学

    Abstract: 本发明公开了一种大规模异构类脑集群软件栈融合方法和系统,其通过软件栈的嵌入调用、层级调用和融合,实现异构计算节点的高效协同;采用池化层资源调度和通信延迟隐藏技术,提升集群通信性能;引入资源映射和任务调度策略,增强系统的适应性和灵活性。同时引入虚拟化技术,将异构硬件资源池化为可动态分配和可调度虚拟资源,提高了资源利用率。在加速器层面,提出了不可拆解纬度的代码运行及通信抽象机制,将加速器的计算和通信任务抽象为信令消息、数据、控制三类型,以简化异构加速器的编程和管理复杂度。通过设备调测和性能分析等手段,保证了系统的可靠运行,提高了任务在大规模异构集群中的执行效率,实现了计算和通信能力的高效运行。

    通用仿真动态监控解析系统、方法、设备及介质

    公开(公告)号:CN118245061B

    公开(公告)日:2024-11-26

    申请号:CN202410378982.1

    申请日:2024-03-29

    Applicant: 清华大学

    Abstract: 本申请涉及一种通用仿真动态监控解析系统、方法、设备及介质,其中,方法包括:仿真环境构建模块,用于基于目标待仿真设备中具有多种类型格式的接口协议,搭建目标待仿真设备的动态仿真环境;仿真数据处理模块,用于基于动态仿真环境,获取仿真数据集,并为每个仿真文件建立对应的内存文件,以根据仿真数据执行预设数据处理操作得到仿真业务处理结果、通信拓扑图和仿真数据查询结果;仿真过程回溯模块,用于根据仿真管理策略生成仿真业务处理结果的多种数据图表,并基于每个仿真文件中的仿真时钟周期,动态显示仿真过程运行参数,从而提高了仿真解析技术对可变仿真数据的通用适配性,有效提升了仿真数据处理效率和仿真器动态仿真能力。

    一种大规模异构类脑集群软件栈融合方法和系统

    公开(公告)号:CN118519765A

    公开(公告)日:2024-08-20

    申请号:CN202410585997.5

    申请日:2024-05-11

    Applicant: 清华大学

    Abstract: 本发明公开了一种大规模异构类脑集群软件栈融合方法和系统,其通过软件栈的嵌入调用、层级调用和融合,实现异构计算节点的高效协同;采用池化层资源调度和通信延迟隐藏技术,提升集群通信性能;引入资源映射和任务调度策略,增强系统的适应性和灵活性。同时引入虚拟化技术,将异构硬件资源池化为可动态分配和可调度虚拟资源,提高了资源利用率。在加速器层面,提出了不可拆解纬度的代码运行及通信抽象机制,将加速器的计算和通信任务抽象为信令消息、数据、控制三类型,以简化异构加速器的编程和管理复杂度。通过设备调测和性能分析等手段,保证了系统的可靠运行,提高了任务在大规模异构集群中的执行效率,实现了计算和通信能力的高效运行。

    基于异构分布式集群的多任务调度方法和装置

    公开(公告)号:CN118227291A

    公开(公告)日:2024-06-21

    申请号:CN202410377580.X

    申请日:2024-03-29

    Applicant: 清华大学

    Abstract: 本发明提供了一种基于异构分布式集群的多任务调度方法和装置,涉及多任务处理技术领域,方法包括:对待处理任务队列中的任务进行分析获得对应的任务描述信息,任务描述信息包括任务种类、优先级、截止时间和任务所需资源类型及数量;将任务描述信息记录在池化层的任务管理表中;基于池化层的资源管理表中记录的集群资源数据进行资源利用评估获得资源评估结果;调度层基于资源评估结果和任务管理表中的任务描述信息为每个任务的执行分配相应的硬件资源。本发明能够将任务分配给最适合的资源执行,从而缩短任务的完成时间和减少等待时间,还能够实时监控资源使用情况和负载状态,动态调整资源分配和任务调度策略,以应对工作负载的变化。

    一种服务器通信系统传输排队调度方法、系统及存储介质

    公开(公告)号:CN118573638A

    公开(公告)日:2024-08-30

    申请号:CN202410540570.3

    申请日:2024-04-30

    Applicant: 清华大学

    Abstract: 本发明提供一种服务器通信系统传输排队调度方法、系统及存储介质,包括:初始化通信传输通道,获取所述通信传输通道的资源状态信息;预设的调度服务端通过设定端口接收用户的通信任务请求并进行验证;所述调度服务端将验证通过的通信任务按照设定规则加入传输队列;所述调度服务端根据所述传输队列的排队信息对传输队列中的通信任务进行调度和资源分配,根据资源分配结果进行通信任务的传输。本发明解决了现有集群系统中通信传输排队调度通信效率低和有限硬件资源的通信需求的高并发的问题,提高了集群系统的多任务处理并行效率。

    通用仿真动态监控解析系统、方法、设备及介质

    公开(公告)号:CN118245061A

    公开(公告)日:2024-06-25

    申请号:CN202410378982.1

    申请日:2024-03-29

    Applicant: 清华大学

    Abstract: 本申请涉及一种通用仿真动态监控解析系统、方法、设备及介质,其中,方法包括:仿真环境构建模块,用于基于目标待仿真设备中具有多种类型格式的接口协议,搭建目标待仿真设备的动态仿真环境;仿真数据处理模块,用于基于动态仿真环境,获取仿真数据集,并为每个仿真文件建立对应的内存文件,以根据仿真数据执行预设数据处理操作得到仿真业务处理结果、通信拓扑图和仿真数据查询结果;仿真过程回溯模块,用于根据仿真管理策略生成仿真业务处理结果的多种数据图表,并基于每个仿真文件中的仿真时钟周期,动态显示仿真过程运行参数,从而提高了仿真解析技术对可变仿真数据的通用适配性,有效提升了仿真数据处理效率和仿真器动态仿真能力。

    一种计算集群联合仿真器同步处理方法、装置及系统

    公开(公告)号:CN118227261A

    公开(公告)日:2024-06-21

    申请号:CN202410321008.1

    申请日:2024-03-20

    Applicant: 清华大学

    Abstract: 本公开涉及仿真技术领域,尤其涉及一种计算集群联合仿真器同步处理方法、装置及系统。所述方法包括:计算集群多个仿真器获取同步周期,同步周期用于统一计算集群多个仿真器在时间尺度上的仿真时间;在每个同步周期内,计算集群多个仿真器独立执行各自的仿真任务;在每个同步周期结束时,计算集群多个仿真器之间交换各自的同步数据,同步数据用于指示仿真任务的执行情况。本公开实施例提供的计算集群联合仿真器同步处理方法通过在同步周期结束时交换同步数据,可以确保各仿真器在相同时间点进行同步,提高了仿真的同步精度,保证了仿真结果的准确性。

Patent Agency Ranking