-
公开(公告)号:CN115269195B
公开(公告)日:2024-08-30
申请号:CN202210933675.6
申请日:2022-08-04
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50 , G06F9/4401 , G06N10/20 , G06N10/40
Abstract: 一种基于操作系统内核的量子计算资源管理方法,属于量子计算技术领域。本发明包括如下步骤:步骤1,解析当前量子计算任务所需的量子计算资源;步骤2,根据量子计算资源和当前系统中可用计算资源,给当前量子任务分配并映射相应的量子比特;步骤3,检测量子计算资源中量子比特的状态,若量子比特状态不满足计算需求,则对量子比特实施校准;步骤4,根据当前量子任务中所包含的量子逻辑门操作生成对应的控制脉冲波形文件;步骤5,根据控制脉冲波形文件,控制量子计算资源执行量子计算;步骤6,测量本次量子计算任务的计算结果。本发明对用户屏蔽了复杂的量子特性,为上层软件提供稳定的量子态描述,方便用户使用和控制量子设备。
-
公开(公告)号:CN112398750B
公开(公告)日:2024-02-06
申请号:CN201910764215.3
申请日:2019-08-19
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种并行计算中作业启动数据压缩传递方法,包括以下步骤:S11、启动作业,获取需要发送至运行该作业任务的计算资源的全数据信息;S12、将全数据信息压缩为删减了重复共性信息的属性数据信息;S2、将属性数据信息压缩为通过单独的格式化语句描述的格式数据信息;S3、获得压缩后的,用于发送至计算资源的传输数据信息;S4、对传输数据信息进行对应于通用压缩算法的通用解压缩和反向数据解析,获得原始的全数据信息;S5、计算资源各自的作业程序将获得的全数据信息进行本地存储,当计算资源需要数据信息时,可直接通过本地读取。本发明解决了大规模作业启动过程中信息传递量大、时间长的问题,提高了大规模作业启动的效率,并有效缓解了网络压力。
-
公开(公告)号:CN115269195A
公开(公告)日:2022-11-01
申请号:CN202210933675.6
申请日:2022-08-04
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50 , G06F9/4401 , G06N10/20 , G06N10/40
Abstract: 一种基于操作系统内核的量子计算资源管理方法,属于量子计算技术领域。本发明包括如下步骤:步骤1,解析当前量子计算任务所需的量子计算资源;步骤2,根据量子计算资源和当前系统中可用计算资源,给当前量子任务分配并映射相应的量子比特;步骤3,检测量子计算资源中量子比特的状态,若量子比特状态不满足计算需求,则对量子比特实施校准;步骤4,根据当前量子任务中所包含的量子逻辑门操作生成对应的控制脉冲波形文件;步骤5,根据控制脉冲波形文件,控制量子计算资源执行量子计算;步骤6,测量本次量子计算任务的计算结果。本发明对用户屏蔽了复杂的量子特性,为上层软件提供稳定的量子态描述,方便用户使用和控制量子设备。
-
公开(公告)号:CN112395150B
公开(公告)日:2022-10-04
申请号:CN201910764228.0
申请日:2019-08-19
Applicant: 无锡江南计算技术研究所
IPC: G06F11/30
Abstract: 本发明公开一种计算节点功耗感知方法,包括以下步骤:运行带外系统;数据感知和登记程序模块周期性调用数据感知与转换模块,以获取节点的功耗数据;数据感知与转换模块读取传感器的原始电压、电流数据,并将来自传感器的原始电压、电流数据转换为节点的功耗数据;数据感知和登记程序模块将从数据感知与转换模块获取的功耗数据写入带内系统CPU的寄存器;数据感知和登记程序模块等待时间T后,转入步骤二,依此循环;当带外系统需要获取节点功耗数据时,功耗查询接口调用数据感知与转换模块,获取节点功耗数据。本发明解决了现有的计算机节点功耗数据感知方法高度依赖带内外网络传输、时效差、代价高、数据不完整的问题。
-
公开(公告)号:CN114218846A
公开(公告)日:2022-03-22
申请号:CN202110324746.8
申请日:2021-03-26
Applicant: 无锡江南计算技术研究所
IPC: G06F30/27 , G06F119/02
Abstract: 本发明公开一种超级计算机计算资源故障预测方法,包括以下步骤:S1、每隔s秒采集一个计算节点的特征信息,记为x1s;N个s秒为时间窗口T;S2、经过m个时间窗口T的数据积累,得到m个总特征X作为输入样本;S3、将S2中经数据处理后的m个总特征X和对应状态Y按batch大小划分成组;S4、从(m+1)个时间窗口T开始,将采集到的最新的总特征X_test和对应状态Y_test根据S2进行数据处理;S5、设置阈值并对比预测结果Y’和对应状态Y_test,当偏差大于设定的阈值时,将训练模型进行调参重训练,重复S4。本发明解决了超级计算机计算资源故障难以有效提前预测的问题。
-
公开(公告)号:CN112100019B
公开(公告)日:2021-03-23
申请号:CN201910863431.3
申请日:2019-09-12
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种面向大规模系统的多源故障协同分析定位方法,包括以下步骤:S1、对各故障监测模块采集到的故障进行统一分类,给每个故障定义一个故障编码Fid,给每个故障定义上下关联列表Fuplist和Fdownlist,上关联列表Fuplist包含一组会诱发该故障的故障编码Fid,下关联列表Fdownlist包含一组该故障会诱发的故障的Fid;S2、故障分析系统接收来自各故障监测模块发送过来的故障,形成一个当前故障列表;S3、故障分析系统对当前故障列表进行上下关联分析;S10、故障分析系统实现对一个故障Fk的精确定位,跳转S4。本发明提高了系统故障自动分析定位能力,解决了大规模并行系统故障的准确定位难题。
-
公开(公告)号:CN112445154A
公开(公告)日:2021-03-05
申请号:CN201910794749.0
申请日:2019-08-27
Applicant: 无锡江南计算技术研究所
IPC: G05B19/042
Abstract: 本发明公开一种异构众核处理器温度报警的多级处理方法,包括以下步骤:处理器的监测系统通过温度传感器实时检测处理器的温度信息,并将检测到的温度信息传输至监测系统;当监测系统接收到的温度信息的数值高于设定的温度阈值时,发出报警信息,并对出现预警的处理器节点的主核和从核进行降频降压操作,并在降频降压操作过程中跟踪记录相应处理器节点的温度信息;在设定的时间区间内,比较处理器节点的温度信息和设定的温度阈值,如果处理器节点的温度信息的数值低于设定的温度阈值,则将处理器恢复至正常运行状态,否则,执行下一步。本发明采用多级处理方法避免了过早采取开销较大的控制手段,兼顾了有效性和开销。
-
公开(公告)号:CN112433829A
公开(公告)日:2021-03-02
申请号:CN201910788892.9
申请日:2019-08-26
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种以用户为核心的高性能计算机资源管理方法,基于以下模块:用户队列模块,包含所有使用高性能计算机系统的用户,每个用户可以使用1~2个有限队列资源;计算队列模块,可包含高性能计算机系统中所有的计算节点,且每个计算节点只能加入到一个计算队列;计算节点队列模块,将计算节点按照该节点的网络地址进行编号;资源管理系统,当用户队列模块中的用户向计算队列模块中的计算队列提交作业时,用于判断该用户下面是否包含有该队列。本发明解决了大型超算中心计算资源管理低效问题,提高高性能计算机系统计算资源的管理和服务能力。
-
公开(公告)号:CN112398750A
公开(公告)日:2021-02-23
申请号:CN201910764215.3
申请日:2019-08-19
Applicant: 无锡江南计算技术研究所
IPC: H04L12/815 , H04L29/06
Abstract: 本发明公开一种并行计算中作业启动数据压缩传递方法,包括以下步骤:S11、启动作业,获取需要发送至运行该作业任务的计算资源的全数据信息;S12、将全数据信息压缩为删减了重复共性信息的属性数据信息;S2、将属性数据信息压缩为通过单独的格式化语句描述的格式数据信息;S3、获得压缩后的,用于发送至计算资源的传输数据信息;S4、对传输数据信息进行对应于通用压缩算法的通用解压缩和反向数据解析,获得原始的全数据信息;S5、计算资源各自的作业程序将获得的全数据信息进行本地存储,当计算资源需要数据信息时,可直接通过本地读取。本发明解决了大规模作业启动过程中信息传递量大、时间长的问题,提高了大规模作业启动的效率,并有效缓解了网络压力。
-
公开(公告)号:CN102929373A
公开(公告)日:2013-02-13
申请号:CN201210398111.3
申请日:2012-10-18
Applicant: 无锡江南计算技术研究所
IPC: G06F1/24
Abstract: 本发明提供了一种多核处理器复位方法,所述方法包括:读取复位信息;根据所述复位信息对多个处理器核进行复位操作,如果所述多个处理器核没有全部复位成功,则在预定次数内对所述多个处理器核重复执行所述复位操作,直至所述多个处理器核全部复位成功;以及如果经过所述预定次数的复位操作后,所述多个处理器核仍没有全部复位成功,则对所述多个处理器核中经过所述预定次数的复位操作后仍复位失败的处理器核进行临时隔离,并对所述多个处理器核中未隔离的处理器核进行再次复位操作。所述方法可以避免对处理器核进行错误的故障判断,从而避免可用处理器核因偶然失败而闲置。
-
-
-
-
-
-
-
-
-