面向异构GPU机间直接通信的自动化测试系统和方法

    公开(公告)号:CN119127624B

    公开(公告)日:2025-03-14

    申请号:CN202411625060.2

    申请日:2024-11-14

    Abstract: 本发明公开了一种面向异构GPU机间直接通信的自动化测试系统和方法,所述方法包括:由用户检查和配置测试参数并提交测试请求,测试管理器解析请求后进行调度处理,执行具体测试流程,最后收集测试数据,并进行结果分析和测试报告的生成。为实现以上方法,本系统包括以下模块:用户界面模块、测试管理器模块、配置数据库模块、测试执行器模块、网络接口模块、结果分析器模块、以及报告生成器模块,各模块间协调处理以完成异构GPU环境中机器间GPU Direct RDMA方式下高速通信的自动化测试。本系统支持多种GPU厂商的软硬件配置,提供标准化的测试流程和方法,解决了异构GPU环境下GDR测试繁琐和效率低下问题。

    一种分布式训练的集合通信控制方法、装置及介质

    公开(公告)号:CN119336451A

    公开(公告)日:2025-01-21

    申请号:CN202411863321.4

    申请日:2024-12-17

    Abstract: 本申请公开了一种分布式训练的集合通信控制方法、装置及介质,该方法包括:当参与数据归约的集群中,任意两个集群之间的计算节点数量的差距在预设范围内时,将第一集群内所有计算节点上的数据归约至指定计算节点上,指定计算节点的数量与计算节点数量最小的第二集群内计算节点的数量相同。控制指定计算节点与第二集群内的计算节点进行数据归约;控制指定计算节点与第一集群内除指定计算节点外的其他节点数据同步。由此,除计算节点数量最少的集群外的其他集群,先在集群内部进行一次归约,将数据归约至数量与各集群中最少节点的数量相同的指定计算节点上,保证跨集群归约时各集群节点相同,避免一些节点同时和多个节点归约,降低集合通信开销。

    一种数据处理方法及装置

    公开(公告)号:CN119576844B

    公开(公告)日:2025-04-22

    申请号:CN202510141804.1

    申请日:2025-02-08

    Abstract: 本说明书公开了一种数据处理方法及装置。所述方法包括:集合通信集群中的任一计算节点接收上一个计算节点发送的第一数据切片,根据接收到的第一数据切片执行计算任务,并将独立于计算任务的待发送的任务数据拆分为多个不存在依赖关系的第二数据切片;依次将各第二数据切片发送给下一个计算节点,以使下一个计算节点在根据接收到的第二数据切片执行计算任务的同时,接收后续的第二数据切片;在根据计算节点中的全部任务数据执行计算任务后,得到目标计算结果。本方案有效提高了集合通信集群对数据进行传输和计算的整体效率。

    一种数据处理方法及装置

    公开(公告)号:CN119576844A

    公开(公告)日:2025-03-07

    申请号:CN202510141804.1

    申请日:2025-02-08

    Abstract: 本说明书公开了一种数据处理方法及装置。所述方法包括:集合通信集群中的任一计算节点接收上一个计算节点发送的第一数据切片,根据接收到的第一数据切片执行计算任务,并将独立于计算任务的待发送的任务数据拆分为多个不存在依赖关系的第二数据切片;依次将各第二数据切片发送给下一个计算节点,以使下一个计算节点在根据接收到的第二数据切片执行计算任务的同时,接收后续的第二数据切片;在根据计算节点中的全部任务数据执行计算任务后,得到目标计算结果。本方案有效提高了集合通信集群对数据进行传输和计算的整体效率。

    一种PCIe设备远程控制方法、装置、电子设备、介质

    公开(公告)号:CN119536918A

    公开(公告)日:2025-02-28

    申请号:CN202510107481.4

    申请日:2025-01-23

    Abstract: 本发明公开了一种PCIe设备远程控制方法、装置、电子设备、介质,所述装置包括:本地服务器和远端服务器;所述本地服务器上部署有PCIe硬件设备控制组件、虚拟PCIe总线、若干本地RDMA网卡;所述远端服务器上部署有PCIe硬件设备、PCIe硬件设备代理组件、若干远端RDMA网卡;所述PCIe硬件设备控制组件用于实现部署于远端服务器上的PCIe硬件设备在本地CPU上的虚拟PCIe设备呈现;所述虚拟PCIe总线用于为本地CPU管理虚拟PCIe总线及总线上的虚拟PCIe设备;所述PCIe硬件设备代理组件与部署于远端服务器上的PCIe硬件设备一一配对,用于完成远端RDMA网卡与PCIe硬件设备间的PCIe请求的代理转发。

    一种计算内核动态调度系统及方法

    公开(公告)号:CN119336510A

    公开(公告)日:2025-01-21

    申请号:CN202411863320.X

    申请日:2024-12-17

    Abstract: 本说明书公开了一种计算内核动态调度系统及方法,计算内核动态调度系统包括:请求管理模块、调度管理模块、监控管理模块、运行管理模块,请求管理模块用于将属于不同目标任务的各待运行计算内核存放到不同的队列中进行管理,调度管理模块用于针对队列中的每个计算内核,根据监控管理模块采集的每个计算内核的执行特征数据,确定每个计算内核对于迟延的允许程度,以确定每个计算内核的后置系数,进而可以按照每个计算内核的后置系数,将各计算内核调度到相应的目标计算内核中运行,从而可以提升通过指定芯片运行各目标任务时的效率。

    一种面向Triton编译器流水线的优化系统及优化方法

    公开(公告)号:CN118605850B

    公开(公告)日:2024-11-12

    申请号:CN202411075543.X

    申请日:2024-08-07

    Abstract: 本发明公开一种面向Triton编译器流水线的优化系统及优化方法,系统包括方言管理器、转换过程管理器、自定义优化过程构造器、优化过程管理器、流水线构造器、优化过程测试器和性能评估器。本发明通过自定义优化过程构造器为用户提供的用于编写转换过程涉及的方言的操作组合的性能优化策略的接口和模板,使得用户能够有针对性地设计优化策略,提升代码运算性能;优化过程管理器允许针对不同GPU架构添加特定的优化pass过程,使得优化系统具有更好的GPU适应性;优化过程测试器确保优化过程的正确执行,性能评估器提供量化评估,使得优化效果可验证。本发明的优化系统能够对方言、转换过程、优化过程进行精细控制,提供了优化系统的管理灵活性和可扩展性。

    一种PCIe设备远程控制方法、装置、电子设备、介质

    公开(公告)号:CN119536918B

    公开(公告)日:2025-04-11

    申请号:CN202510107481.4

    申请日:2025-01-23

    Abstract: 本发明公开了一种PCIe设备远程控制方法、装置、电子设备、介质,所述装置包括:本地服务器和远端服务器;所述本地服务器上部署有PCIe硬件设备控制组件、虚拟PCIe总线、若干本地RDMA网卡;所述远端服务器上部署有PCIe硬件设备、PCIe硬件设备代理组件、若干远端RDMA网卡;所述PCIe硬件设备控制组件用于实现部署于远端服务器上的PCIe硬件设备在本地CPU上的虚拟PCIe设备呈现;所述虚拟PCIe总线用于为本地CPU管理虚拟PCIe总线及总线上的虚拟PCIe设备;所述PCIe硬件设备代理组件与部署于远端服务器上的PCIe硬件设备一一配对,用于完成远端RDMA网卡与PCIe硬件设备间的PCIe请求的代理转发。

    一种面向Triton编译器流水线的优化系统及优化方法

    公开(公告)号:CN118605850A

    公开(公告)日:2024-09-06

    申请号:CN202411075543.X

    申请日:2024-08-07

    Abstract: 本发明公开一种面向Triton编译器流水线的优化系统及优化方法,系统包括方言管理器、转换过程管理器、自定义优化过程构造器、优化过程管理器、流水线构造器、优化过程测试器和性能评估器。本发明通过自定义优化过程构造器为用户提供的用于编写转换过程涉及的方言的操作组合的性能优化策略的接口和模板,使得用户能够有针对性地设计优化策略,提升代码运算性能;优化过程管理器允许针对不同GPU架构添加特定的优化pass过程,使得优化系统具有更好的GPU适应性;优化过程测试器确保优化过程的正确执行,性能评估器提供量化评估,使得优化效果可验证。本发明的优化系统能够对方言、转换过程、优化过程进行精细控制,提供了优化系统的管理灵活性和可扩展性。

Patent Agency Ranking