-
公开(公告)号:CN117151183A
公开(公告)日:2023-12-01
申请号:CN202311122958.3
申请日:2023-09-01
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种用于深度学习的芯粒互联系统,所述芯粒中每个芯粒设有电光通信端口,所述芯粒分为CPU芯粒和GPU芯粒,所述系统包括:至少一个CPU芯粒,其用于管控深度学习任务相关数据的收发与任务执行流程,并且所述CPU芯粒设有电光通信端口;多个GPU芯粒,其用于根据深度学习任务相关数据执行深度学习任务,并且所述GPU芯粒设有电光通信端口;多个阵列波导光栅路由器,其用于对以光波承载的深度学习任务相关的数据,其中,所述阵列波导光栅路由器与所述芯粒通过3D堆叠技术封装在不同的芯片层;多个硅光收发器,其每个硅光收发器用于一个芯粒的电光通信端口与对应阵列波导光栅路由器之间的连接与电光信号转换。
-
公开(公告)号:CN117636004A
公开(公告)日:2024-03-01
申请号:CN202311412021.X
申请日:2023-10-27
Applicant: 中国科学院计算技术研究所
IPC: G06V10/764 , G06V10/774 , G06V10/94 , G06V10/82 , G06N3/0499 , G06N3/084
Abstract: 本发明提出一种基于通信需求和网络资源匹配的分布式训练任务分配搜索方法,该方法分为并行策略搜索和任务放置搜索。并行策略搜索提供先乘法步叠加后加法步叠加的方法快速搜索并行配置,任务放置搜索基于分布式训练通信行为建模,为分布式训练生成点对点流量矩阵,并将其与网络资源相匹配。实现高效的任务分配,解决在训练集群上的并行策略的搜索和任务放置问题,能够有效给出并行训练的部署方案。
-