-
公开(公告)号:CN114218022A
公开(公告)日:2022-03-22
申请号:CN202110398218.7
申请日:2021-04-14
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种PCIE接口正确性测试方法,包括以下步骤:S1、A方在发送数据前,对发送缓冲区进行填充,填充消息描述符;S2、A方开始向B方发送数据;S3、B方等待接收数据;S4、A方等待接收B方发来的数据,在收到B方发送的数据后,进行数据正确性校验;S7、回到S1,直到遍历完成所有布数方式、操作类型、消息长度和消息偏移测试。本发明提高了PCIE接口正确性测试覆盖面和测试强度。
-
公开(公告)号:CN114244692A
公开(公告)日:2022-03-25
申请号:CN202110480187.X
申请日:2021-04-30
Applicant: 无锡江南计算技术研究所
IPC: H04L41/0677 , H04L43/0894
Abstract: 本发明公开一种适用于超大规模互连网络的故障快速定位方法,包括以下步骤:S1、以CPU为单位,每个CPU起2个进程,每个进程占用一个引擎,2个进程进行对发带宽测试,检查带宽是否正常,筛选出PCIE链路及存控有问题的点;S2、以中板为单位,每个CPU上选2个进程,每个进程使用1个引擎,进程以异或算法进行A2A测试,检查每轮通信带宽是否低于阈值,筛选出有问题的计算网交换机;S3、以整个队列为单位,从每个中板中选出指定进程,所有中板一起进行A2A测试,筛选出有问题的顶层网交换机。本发明解决网络故障定位效率低和循环连续检查每个节点造成收发堵塞问题,极大提高网络故障的诊断效率。
-
公开(公告)号:CN114218022B
公开(公告)日:2025-05-16
申请号:CN202110398218.7
申请日:2021-04-14
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种PCIE接口正确性测试方法,包括以下步骤:S1、A方在发送数据前,对发送缓冲区进行填充,填充消息描述符;S2、A方开始向B方发送数据;S3、B方等待接收数据;S4、A方等待接收B方发来的数据,在收到B方发送的数据后,进行数据正确性校验;S7、回到S1,直到遍历完成所有布数方式、操作类型、消息长度和消息偏移测试。本发明提高了PCIE接口正确性测试覆盖面和测试强度。
-
公开(公告)号:CN114221861B
公开(公告)日:2023-07-07
申请号:CN202110324736.4
申请日:2021-03-26
Applicant: 无锡江南计算技术研究所
IPC: H04L41/0803 , H04L41/06 , H04L47/10
Abstract: 本发明公开一种大规模互连网络的管理包收发方法,包括以下步骤:S1、初始设置;S2、自动控制,具体如下:S21、命令发送线程在发送时,判断curr_send_package是否小于max_send_package,若小于,则启动一个定时器,发送命令,加线程锁,curr_send_package+1,解除线程锁;否则,阻塞该线程,等待该线程被唤醒;S22、命令接收线程,接收到管理包,加线程锁,curr_send_package‑1,解除线程锁,发送唤醒线程信号;S3、自动处理。本发明解决了大规模互连网络中网络管理包收发堵塞和网络管理包收发效率低的问题。
-
公开(公告)号:CN114221861A
公开(公告)日:2022-03-22
申请号:CN202110324736.4
申请日:2021-03-26
Applicant: 无锡江南计算技术研究所
IPC: H04L41/0803 , H04L41/06 , H04L47/10
Abstract: 本发明公开一种大规模互连网络的管理包收发方法,包括以下步骤:S1、初始设置;S2、自动控制,具体如下:S21、命令发送线程在发送时,判断curr_send_package是否小于max_send_package,若小于,则启动一个定时器,发送命令,加线程锁,curr_send_package+1,解除线程锁;否则,阻塞该线程,等待该线程被唤醒;S22、命令接收线程,接收到管理包,加线程锁,curr_send_package‑1,解除线程锁,发送唤醒线程信号;S3、自动处理。本发明解决了大规模互连网络中网络管理包收发堵塞和网络管理包收发效率低的问题。
-
公开(公告)号:CN114218021A
公开(公告)日:2022-03-22
申请号:CN202110347331.2
申请日:2021-03-31
Applicant: 无锡江南计算技术研究所
IPC: G06F11/22
Abstract: 本发明公开一种基于RNIC的多核处理器上消息性能故障定位方法,包括以下步骤:S1:在存控K上申请两片内存空间;S2:按K递增的顺序,通过RNIC串行将存控K中的发送数据发送到存控K中的接收数据中,进行第K+1轮测试;S3:得到测试性能数据bwK;S5:在存控K上申请两片内存空间;S6:通过RNIC并行将存控K中的发送数据发送到存控K+S中的接收数据中,进行第step=S+1轮测试;S7:计算消息性能bwS_K;S8:通过判断bwS_K是否低于最低带宽阈值bw_threshold来判断故障原因。本发明解决了基于RNIC的多核处理器上消息性能故障定位难的问题。
-
公开(公告)号:CN114218021B
公开(公告)日:2025-01-10
申请号:CN202110347331.2
申请日:2021-03-31
Applicant: 无锡江南计算技术研究所
IPC: G06F11/22
Abstract: 本发明公开一种基于RNIC的多核处理器上消息性能故障定位方法,包括以下步骤:S1:在存控K上申请两片内存空间;S2:按K递增的顺序,通过RNIC串行将存控K中的发送数据发送到存控K中的接收数据中,进行第K+1轮测试;S3:得到测试性能数据bwK;S5:在存控K上申请两片内存空间;S6:通过RNIC并行将存控K中的发送数据发送到存控K+S中的接收数据中,进行第step=S+1轮测试;S7:计算消息性能bwS_K;S8:通过判断bwS_K是否低于最低带宽阈值bw_threshold来判断故障原因。本发明解决了基于RNIC的多核处理器上消息性能故障定位难的问题。
-
公开(公告)号:CN114244692B
公开(公告)日:2024-02-02
申请号:CN202110480187.X
申请日:2021-04-30
Applicant: 无锡江南计算技术研究所
IPC: H04L41/0677 , H04L43/0894
Abstract: 本发明公开一种适用于超大规模互连网络的故障快速定位方法,包括以下步骤:S1、以CPU为单位,每个CPU起2个进程,每个进程占用一个引擎,2个进程进行对发带宽测试,检查带宽是否正常,筛选出PCIE链路及存控有问题的点;S2、以中板为单位,每个CPU上选2个进程,每个进程使用1个引擎,进程以异或算法进行A2A测试,检查每轮通信带宽是否低于阈值,筛选出有问题的计算网交换机;S3、以整个队列为单位,从每个中板中选出指定进程,所有中板一起进行A2A测试,筛选出有问题的顶层网交换机。本发明解决网络故障定位效率低和循环连续检查每个节点造成收发堵塞问题,极大提高网络故障的诊断效率。
-
-
-
-
-
-
-