-
公开(公告)号:CN109067506A
公开(公告)日:2018-12-21
申请号:CN201810929668.2
申请日:2018-08-15
Applicant: 无锡江南计算技术研究所
IPC: H04L1/18
CPC classification number: H04L1/1832 , H04L1/1822 , H04L1/1841
Abstract: 本发明公开一种基于多滑动窗口并发的轻量级异步消息实现方法,该方法通过发送方消息重传和接收方消息排重,由软硬件协作共同实现异步消息的可靠传输,极大地降低了硬件实现异步消息容错的复杂度。与传统滑动窗口相比,通信双方无需进行握手和信用反馈,无需对乱序数据包进行缓存,降低了维护并发窗口的内存开销和CPU开销;支持多个独立的滑动窗口并发工作,可以大幅提高异步消息的带宽。
-
公开(公告)号:CN108696436A
公开(公告)日:2018-10-23
申请号:CN201810929670.X
申请日:2018-08-15
Applicant: 无锡江南计算技术研究所
IPC: H04L12/741 , H04L12/751 , H04L12/24 , H04L12/26
CPC classification number: H04L45/02 , H04L41/046 , H04L43/06 , H04L43/10 , H04L45/54
Abstract: 本发明公开一种分布式网络拓扑探查与路由分发系统及方法,该系统包括主子网管理和若干个子网管理代理;所述主子网管理用于:以动态方式将包括交换机和网卡在内的所有网络节点平均分配给不同的子网管理代理;将各子网管理代理收集的数据进行汇总后根据路由算法计算路由表;同时向子网管理代理发送交换机路由表分发命令;所述子网管理代理用于收集各自监控对象的拓扑结构,并将信息发送给主子网管理。本发明通过分布式子网管理方式来实现分布式拓扑探查与路由分发,极大地缩短了网络拓扑探查和路由的分发时间,提高了大规模互连网络管理动态探查和路由分发的效率,提升了网络管理系统的可用性。
-
公开(公告)号:CN102546202A
公开(公告)日:2012-07-04
申请号:CN201010594009.1
申请日:2010-12-17
Applicant: 无锡江南计算技术研究所
Abstract: 本发明实施例公开了一种无限带宽网路流量监控的方法,包括:管理节点周期性获取连接节点的IB端口硬件计数器的流量数据;管理节点对在预定时刻所获得的某一连接节点的IB端口硬件计数器流量数据进行统计,获得连接节点的总数据流量;管理节点将所获得的某一连接节点的IB端口硬件计数器的总数据流量与网络流量预设值进行比较,总数据流量大于网络流量预设值,发出告警。同时,本发明也公开了与方法对应的装置及系统。本发明所提供的方法、装置及系统实现了对IB网络中所有连接节点在不同时刻的IB端口硬件计数器流量数据的采集,使管理者可以直接了解整个IB网络资源的利用状况,分析和发现网络中的拥塞情况,实现了对网络流量的实时监控。
-
公开(公告)号:CN114218021B
公开(公告)日:2025-01-10
申请号:CN202110347331.2
申请日:2021-03-31
Applicant: 无锡江南计算技术研究所
IPC: G06F11/22
Abstract: 本发明公开一种基于RNIC的多核处理器上消息性能故障定位方法,包括以下步骤:S1:在存控K上申请两片内存空间;S2:按K递增的顺序,通过RNIC串行将存控K中的发送数据发送到存控K中的接收数据中,进行第K+1轮测试;S3:得到测试性能数据bwK;S5:在存控K上申请两片内存空间;S6:通过RNIC并行将存控K中的发送数据发送到存控K+S中的接收数据中,进行第step=S+1轮测试;S7:计算消息性能bwS_K;S8:通过判断bwS_K是否低于最低带宽阈值bw_threshold来判断故障原因。本发明解决了基于RNIC的多核处理器上消息性能故障定位难的问题。
-
公开(公告)号:CN114244692B
公开(公告)日:2024-02-02
申请号:CN202110480187.X
申请日:2021-04-30
Applicant: 无锡江南计算技术研究所
IPC: H04L41/0677 , H04L43/0894
Abstract: 本发明公开一种适用于超大规模互连网络的故障快速定位方法,包括以下步骤:S1、以CPU为单位,每个CPU起2个进程,每个进程占用一个引擎,2个进程进行对发带宽测试,检查带宽是否正常,筛选出PCIE链路及存控有问题的点;S2、以中板为单位,每个CPU上选2个进程,每个进程使用1个引擎,进程以异或算法进行A2A测试,检查每轮通信带宽是否低于阈值,筛选出有问题的计算网交换机;S3、以整个队列为单位,从每个中板中选出指定进程,所有中板一起进行A2A测试,筛选出有问题的顶层网交换机。本发明解决网络故障定位效率低和循环连续检查每个节点造成收发堵塞问题,极大提高网络故障的诊断效率。
-
公开(公告)号:CN112532410B
公开(公告)日:2023-10-31
申请号:CN201910879822.4
申请日:2019-09-18
Applicant: 无锡江南计算技术研究所
IPC: H04L41/12 , H04L41/0813 , H04L49/111
Abstract: 本发明公开了一种大规模互连网络Trap快速响应方法,包括以下步骤:网络管理接收Trap消息,判断状态改变的端口所连接的节点类型是否为网卡,如果是,执行下一步,否则重新探查网络;判断端口变化情况,如果端口由可用变为不可用,不需要响应该Trap消息,维持当前状态不变,如果端口由不可用变为可用,继续执行下一步;判断端口软件可用位是否为可用,如果是,激活该网卡,使其变为可用,否则重新探查网络。本发明优化了网卡端口状态发生改变的处理过程,只有当网卡端口由不可用变为可用,且与其相连的交换机端口的软件可用位也不可用时,才启动探查网络,节省了不必要的网络探查时间,大大提高了网络管理的响应速度。
-
公开(公告)号:CN112422244B
公开(公告)日:2022-11-25
申请号:CN201910771718.3
申请日:2019-08-21
Applicant: 无锡江南计算技术研究所
IPC: H04L5/00 , H04L47/722 , H04L47/83
Abstract: 本发明公开一种基于流量负载预测的RDMA缓冲区动态分配方法,包括以下步骤:S1、检查RDMA被动方是否有可用的RDMA缓冲区;S2、检查未使用的RDMA缓冲区的个数及armed是否为0;S3、RDMA被动方若在规定时间内没有分配任何RDMA缓冲区,则发送一条控制消息将TSER告知RDMA发起方;S4、RDMA发起方不断测量RDMA请求时间间隔、分配RDMA缓冲区的请求/应答时间;S5、根据获得的at和rtt,计算获得加权平均RDMA请求时间间隔avg_at和分配RDMA缓冲区的请求/应答时间间隔avg_rtt;S6、根据avg_at和avg_rtt计算并更新rbuf_thresh的大小。本发明实现对RDMA缓冲区的动态分配,在保证网络高带宽的同时,可以显著降低预先分配的RDMA缓冲区数量,降低内存消耗量。
-
公开(公告)号:CN108880914B
公开(公告)日:2021-08-10
申请号:CN201810930202.4
申请日:2018-08-15
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于网络带宽测试的互连网络故障检测与定位方法,该方法包括:S101、生成配对子集:选出最小、CPU出现次数最均衡的配对子集;S102、运行带宽测试进行故障检测与定位:运行并行测试程序,根据配对表测试每对CPU对间的带宽。本发明能够快速定位大规模互连网络中的故障,缩短排查故障的时间,提升了大规模网络的可用性、易用性、可维护性。
-
公开(公告)号:CN108880914A
公开(公告)日:2018-11-23
申请号:CN201810930202.4
申请日:2018-08-15
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于网络带宽测试的互连网络故障检测与定位方法,该方法包括:S101、生成配对子集:选出最小、CPU出现次数最均衡的配对子集;S102、运行带宽测试进行故障检测与定位:运行并行测试程序,根据配对表测试每对CPU对间的带宽。本发明能够快速定位大规模互连网络中的故障,缩短排查故障的时间,提升了大规模网络的可用性、易用性、可维护性。
-
公开(公告)号:CN102932283B
公开(公告)日:2015-04-08
申请号:CN201210439836.2
申请日:2012-11-06
Applicant: 无锡江南计算技术研究所
IPC: H04L12/931 , H04L12/721
Abstract: 本发明公开了一种无限带宽网络初始化方法及系统,可以在将树形结构的交换机信息转换为数组结构的交换机信息后,使用多线程对其进行计算,并使用多线程,采用流水方式对生成的单播路由表进行分发。因此,本发明使用多线程进行计算和分发可以有效提高IB网络初始化的速度。同时,使用流水方式进行分发可以使得各交换机在分发过程中可用,进一步提高了初始化的效率。
-
-
-
-
-
-
-
-
-