面向深度学习模型参数同步的智算融合网络多路传输方法

    公开(公告)号:CN118972313A

    公开(公告)日:2024-11-15

    申请号:CN202410885351.9

    申请日:2024-07-03

    Abstract: 本发明提供了一种面向深度学习模型参数同步的智算融合网络多路传输方法。该方法包括:智算融合网络中的计算节点周期性向网络中发送INT探测报文,通过INT探测报文收集网络状态信息;控制器通过读取INT探测数据包收集到的信息以及RAR架构分布式深度学习任务的部署信息,判断当前任务的传输路径是否发生了拥塞,当检测到出现拥塞时,调用蚁群算法选择最优的路径组合;利用最优的路径组合替换掉原传输路径中对应的拥塞链路,生成任务主机间的多路传输路径集,向其中涉及的所有交换机节点中添加新的转发规则。本发明将多路传输机制加入到智算融合网络的知识空间,能够调用该机制有效加快该类型任务的模型参数同步速度,更好的满足用户服务需求。

Patent Agency Ranking