-
公开(公告)号:CN117632520B
公开(公告)日:2024-05-17
申请号:CN202410100805.7
申请日:2024-01-25
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F9/50 , G06F15/173 , G06F15/78
Abstract: 本发明涉及基于申威众核处理器的主从核监测交互的计算量调度方法,属于电子信息技术领域。包括:在计算量传输过程中,通过从核状态监测器SW‑CSM实现主核对从核状态的判断与监测;通过主从核协作交互器MCCI实现将计算量均匀分配到每个从核中,完成主从核监测交互的计算量调度。本发明根据单个核组内的资源配置情况,针对因计算量不同而导致的负载不均衡问题,解决了主从核交互过程中执行程序段中的计算量分配问题。该方法可以快捷、便利地实现申威众核处理器主从核交互过程中计算量的均匀分配问题,有效的降低程序执行的时间,从而提高应用程序的并行效率。该方法可以适用于申威系列众核处理器。
-
公开(公告)号:CN117472448A
公开(公告)日:2024-01-30
申请号:CN202311829650.2
申请日:2023-12-28
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F9/38 , G06F15/163
Abstract: 本发明涉及一种申威众核处理器从核簇加速并行方法、设备及介质,属于电子信息技术领域;包括:应用程序优化阶段:对应用程序进行优化;输入导入阶段:将各从核所需的输入条件从主存储器传入LDM连续共享空间;计算与RMA传输阶段:计算从核即刻开始执行计算任务;从核将计算结果传输到主存储器时,由汇总从核将计算结果读取到本地LDM;汇总与整理阶段:汇总从核读取完计算从核此时的计算结果后进行整理;DMA传输阶段:将计算结果传输至主存储器中;重复执行上述阶段直到当前迭代次数达到预先设定的迭代总次数。本发明提供了适合处理以上情况的多种优化方法,拥有明显的加速效果,减少了使用难度,提高了用户体验。
-
公开(公告)号:CN117472448B
公开(公告)日:2024-03-26
申请号:CN202311829650.2
申请日:2023-12-28
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F9/38 , G06F15/163
Abstract: 本发明涉及一种申威众核处理器从核簇加速并行方法、设备及介质,属于电子信息技术领域;包括:应用程序优化阶段:对应用程序进行优化;输入导入阶段:将各从核所需的输入条件从主存储器传入LDM连续共享空间;计算与RMA传输阶段:计算从核即刻开始执行计算任务;从核将计算结果传输到主存储器时,由汇总从核将计算结果读取到本地LDM;汇总与整理阶段:汇总从核读取完计算从核此时的计算结果后进行整理;DMA传输阶段:将计算结果传输至主存储器中;重复执行上述阶段直到当前迭代次数达到预先设定的迭代总次数。本发明提供了适合处理以上情况的多种优化方法,拥有明显的加速效果,减少了使用难度,提高了用户体验。
-
公开(公告)号:CN117632530A
公开(公告)日:2024-03-01
申请号:CN202410100803.8
申请日:2024-01-25
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F9/52 , G06F15/173 , G06F15/78
Abstract: 本发明涉及基于新一代申威众核处理器的从核数量调整并行加速方法,属于电子信息技术领域。包括:定义初始临界资源控制器CRC精确度;在从核访问主存的过程中,通过临界资源控制器CRC控制的形式,以控制多次所得到从核数量对应的平均时间差值为基准,根据时间差值增大或减少的情况进行临界资源控制器CRC精确度大小的调整,在确定临界资源控制器CRC控制的精确度为1时,即比较相邻从核数量所对应的时间,以此得到最佳的时间和最合适的从核数量。本发明解决了从核执行程序段中的数量选择问题。该方法可以快捷、便利地找到最佳的从核数量,有效的降低程序执行的时间,从而提高应用程序的并行效率,可以适用于申威系列众核处理器。
-
公开(公告)号:CN117632520A
公开(公告)日:2024-03-01
申请号:CN202410100805.7
申请日:2024-01-25
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F9/50 , G06F15/173 , G06F15/78
Abstract: 本发明涉及基于申威众核处理器的主从核监测交互的计算量调度方法,属于电子信息技术领域。包括:在计算量传输过程中,通过从核状态监测器SW‑CSM实现主核对从核状态的判断与监测;通过主从核协作交互器MCCI实现将计算量均匀分配到每个从核中,完成主从核监测交互的计算量调度。本发明根据单个核组内的资源配置情况,针对因计算量不同而导致的负载不均衡问题,解决了主从核交互过程中执行程序段中的计算量分配问题。该方法可以快捷、便利地实现申威众核处理器主从核交互过程中计算量的均匀分配问题,有效的降低程序执行的时间,从而提高应用程序的并行效率。该方法可以适用于申威系列众核处理器。
-
公开(公告)号:CN117033026A
公开(公告)日:2023-11-10
申请号:CN202311038791.2
申请日:2023-08-17
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F9/54
Abstract: 本发明涉及一种基于新一代神威超级计算机硬件架构的多层次集合通信的优化方法,包括:根据应用程序所使用的进程数不同,确定应用程序属于哪一种情况;根据新一代神威超级计算机的硬件架构,对不同情况内的1对N型、N对1型、N对N型集合通信函数进行优化,包括:通过进程分组,在各组内进行集合通信,用下层架构中的通信来代替上层架构中的通信。本发明考虑到应用程序所需要的进程数存在多种情况以及实际可供使用的资源,在多种情况下进行了测试。本发明方法在实际使用时所受的进程资源的限制,提供了处理不同资源限制下的方法,减少了使用难度,提高了用户体验。经过本发明方法优化后的集合通信函数拥有明显的加速效果。
-
公开(公告)号:CN117632530B
公开(公告)日:2024-05-03
申请号:CN202410100803.8
申请日:2024-01-25
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F9/52 , G06F15/173 , G06F15/78
Abstract: 本发明涉及基于新一代申威众核处理器的从核数量调整并行加速方法,属于电子信息技术领域。包括:定义初始临界资源控制器CRC精确度;在从核访问主存的过程中,通过临界资源控制器CRC控制的形式,以控制多次所得到从核数量对应的平均时间差值为基准,根据时间差值增大或减少的情况进行临界资源控制器CRC精确度大小的调整,在确定临界资源控制器CRC控制的精确度为1时,即比较相邻从核数量所对应的时间,以此得到最佳的时间和最合适的从核数量。本发明解决了从核执行程序段中的数量选择问题。该方法可以快捷、便利地找到最佳的从核数量,有效的降低程序执行的时间,从而提高应用程序的并行效率,可以适用于申威系列众核处理器。
-
公开(公告)号:CN116909741A
公开(公告)日:2023-10-20
申请号:CN202310878440.6
申请日:2023-07-18
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F9/50 , G06F15/173
Abstract: 本发明涉及一种基于新一代申威众核处理器提高从核并行写共享主存临界资源速度的方法及系统,包括:从核在其私有的局部数据存储器上申请数据空间;将主存储器内的临界资源数据拷贝到各自的私有的局部数据存储器上;各从核进行读写操作;各从核通过远程内存访问(RMA)通道,发起规约操作,规约操作是指将多个从核私有的局部数据存储器内的临界资源数据进行某种聚合函数运算,得到一个最终结果;通过直接内存访问(DMA)通道,将私有的局部数据存储器内规约操作后的临界资源数据写回主存储器。本发明的方法可以有效提高申威众核处理器从核读写共享主存临界资源的速度,提高超级计算机的性能和效率。
-
-
-
-
-
-
-