-
公开(公告)号:CN117474081A
公开(公告)日:2024-01-30
申请号:CN202311408427.0
申请日:2023-10-25
Applicant: 电子科技大学
Abstract: 本发明公开了基于自适应拓扑和辅助路由的分布式机器学习训练系统,包括:用户平面,用于提供构建拓扑的自定义策略;调度平面,包括网络感知模块、策略制定模块以及策略一致性模块;数据平面,包括策略执行模块和网络测量模块。本发明缓解了多智算中心跨广域互联的通信瓶颈问题,解决了现有分布式机器学习系统在资源异构且动态变化的广域网络中效能受限的问题。