一种基于AllReduce架构的高效参数同步方法

    公开(公告)号:CN119788688A

    公开(公告)日:2025-04-08

    申请号:CN202411689019.1

    申请日:2024-11-25

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于AllReduce架构的高效参数同步方法,该方法首先根据底层物理链路带宽对节点进行分组分解,使分解后的链路带宽与通信量相匹配,再根据分解后不同通信阶段的通信量对待通信数据进行分块,最后每个数据块在不同类型链路上以分组分解AllReduce的方式并行地进行参数同步。本发明用于在复杂网络环境下进行高效的参数同步,能克服带宽异构的影响,在多网卡场景下可以高效地并行,单网卡场景下也能利用空闲链路提高并行度,在同构和异构网络环境下都能取得优异的性能表现。

Patent Agency Ranking