-
公开(公告)号:CN105468456A
公开(公告)日:2016-04-06
申请号:CN201510828332.3
申请日:2015-11-24
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50
CPC classification number: G06F9/5005
Abstract: 一种基于可变网络拓扑的并行作业资源调度方法,包括:通过系统计算网络的网络监控发现系统网络拓扑发生变化;网络监控向作业资源调度服务推送网络拓扑变化信息,包括最新的网络拓扑;作业资源调度收到网络拓扑变化信息,对最新的拓扑信息进行预处理,依据网络各节点的拓扑关系形成临时计算资源池信息;与当前计算资源池匹配是否需要进行计算资源池重构,如果需要进行计算资源池重构则冻结作业资源调度服务,暂停系统的作业资源调度,保证系统服务数据的一致性;启动快速计算资源池重构,使用临时计算资源池替换正式计算资源池;形成新的计算资源池;随后解冻作业资源调度服务,利用新的计算资源池继续响应系统的各种作业资源调度请求。
-
公开(公告)号:CN112398750B
公开(公告)日:2024-02-06
申请号:CN201910764215.3
申请日:2019-08-19
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种并行计算中作业启动数据压缩传递方法,包括以下步骤:S11、启动作业,获取需要发送至运行该作业任务的计算资源的全数据信息;S12、将全数据信息压缩为删减了重复共性信息的属性数据信息;S2、将属性数据信息压缩为通过单独的格式化语句描述的格式数据信息;S3、获得压缩后的,用于发送至计算资源的传输数据信息;S4、对传输数据信息进行对应于通用压缩算法的通用解压缩和反向数据解析,获得原始的全数据信息;S5、计算资源各自的作业程序将获得的全数据信息进行本地存储,当计算资源需要数据信息时,可直接通过本地读取。本发明解决了大规模作业启动过程中信息传递量大、时间长的问题,提高了大规模作业启动的效率,并有效缓解了网络压力。
-
公开(公告)号:CN112395150B
公开(公告)日:2022-10-04
申请号:CN201910764228.0
申请日:2019-08-19
Applicant: 无锡江南计算技术研究所
IPC: G06F11/30
Abstract: 本发明公开一种计算节点功耗感知方法,包括以下步骤:运行带外系统;数据感知和登记程序模块周期性调用数据感知与转换模块,以获取节点的功耗数据;数据感知与转换模块读取传感器的原始电压、电流数据,并将来自传感器的原始电压、电流数据转换为节点的功耗数据;数据感知和登记程序模块将从数据感知与转换模块获取的功耗数据写入带内系统CPU的寄存器;数据感知和登记程序模块等待时间T后,转入步骤二,依此循环;当带外系统需要获取节点功耗数据时,功耗查询接口调用数据感知与转换模块,获取节点功耗数据。本发明解决了现有的计算机节点功耗数据感知方法高度依赖带内外网络传输、时效差、代价高、数据不完整的问题。
-
公开(公告)号:CN112445154A
公开(公告)日:2021-03-05
申请号:CN201910794749.0
申请日:2019-08-27
Applicant: 无锡江南计算技术研究所
IPC: G05B19/042
Abstract: 本发明公开一种异构众核处理器温度报警的多级处理方法,包括以下步骤:处理器的监测系统通过温度传感器实时检测处理器的温度信息,并将检测到的温度信息传输至监测系统;当监测系统接收到的温度信息的数值高于设定的温度阈值时,发出报警信息,并对出现预警的处理器节点的主核和从核进行降频降压操作,并在降频降压操作过程中跟踪记录相应处理器节点的温度信息;在设定的时间区间内,比较处理器节点的温度信息和设定的温度阈值,如果处理器节点的温度信息的数值低于设定的温度阈值,则将处理器恢复至正常运行状态,否则,执行下一步。本发明采用多级处理方法避免了过早采取开销较大的控制手段,兼顾了有效性和开销。
-
公开(公告)号:CN112398750A
公开(公告)日:2021-02-23
申请号:CN201910764215.3
申请日:2019-08-19
Applicant: 无锡江南计算技术研究所
IPC: H04L12/815 , H04L29/06
Abstract: 本发明公开一种并行计算中作业启动数据压缩传递方法,包括以下步骤:S11、启动作业,获取需要发送至运行该作业任务的计算资源的全数据信息;S12、将全数据信息压缩为删减了重复共性信息的属性数据信息;S2、将属性数据信息压缩为通过单独的格式化语句描述的格式数据信息;S3、获得压缩后的,用于发送至计算资源的传输数据信息;S4、对传输数据信息进行对应于通用压缩算法的通用解压缩和反向数据解析,获得原始的全数据信息;S5、计算资源各自的作业程序将获得的全数据信息进行本地存储,当计算资源需要数据信息时,可直接通过本地读取。本发明解决了大规模作业启动过程中信息传递量大、时间长的问题,提高了大规模作业启动的效率,并有效缓解了网络压力。
-
公开(公告)号:CN112445632A
公开(公告)日:2021-03-05
申请号:CN201910831168.X
申请日:2019-09-04
Applicant: 无锡江南计算技术研究所
IPC: G06F11/00
Abstract: 本发明公开一种基于故障数据建模的HPC可靠性评估方法,包括以下步骤:对目标系统的所有故障单元,进行故障数据采集;基于故障严重等级,对采集到的故障数据进行故障分类,将故障数据分为严重故障数据与非严重故障数据;筛除与失效无关的非严重故障数据;选定时间区间,将该时间区间内的所有严重故障数据作为采样样本,采用最大似然估计法,计算weibull分布参数,获得该时间区间内的目标系统的失效时间分布模型;计算时间区间上的目标系统的MTTF,即weibull分布的特征值;根据不同时间区间的目标系统的MTTF变化,评估目标系统的可靠性变化特征。本发明能够真实反映系统运行中的可靠性指标,可以在线分析出系统在不同时间段的可靠性水平,指导系统容错和日常运维。
-
公开(公告)号:CN112395150A
公开(公告)日:2021-02-23
申请号:CN201910764228.0
申请日:2019-08-19
Applicant: 无锡江南计算技术研究所
IPC: G06F11/30
Abstract: 本发明公开一种计算节点功耗感知方法,包括以下步骤:运行带外系统;数据感知和登记程序模块周期性调用数据感知与转换模块,以获取节点的功耗数据;数据感知与转换模块读取传感器的原始电压、电流数据,并将来自传感器的原始电压、电流数据转换为节点的功耗数据;数据感知和登记程序模块将从数据感知与转换模块获取的功耗数据写入带内系统CPU的寄存器;数据感知和登记程序模块等待时间T后,转入步骤二,依此循环;当带外系统需要获取节点功耗数据时,功耗查询接口调用数据感知与转换模块,获取节点功耗数据。本发明解决了现有的计算机节点功耗数据感知方法高度依赖带内外网络传输、时效差、代价高、数据不完整的问题。
-
公开(公告)号:CN105487634A
公开(公告)日:2016-04-13
申请号:CN201510828279.7
申请日:2015-11-24
Applicant: 无锡江南计算技术研究所
IPC: G06F1/32
CPC classification number: G06F1/3287
Abstract: 一种面向异构众核芯片的量化功耗控制方法,包括:获取异构众核芯片在每种状态下的基准功耗数据,建立外部的基础功耗数据表;获取异构众核芯片所支持的所有稳定运行频率的频率档次表;而且针对所有稳定运行频率建立不同频率下运行相同应用代码的芯片功耗存在关系,其中,频率越高,功耗越大,并且最低频率档次工作功耗一定小于最大稳定运行功耗;建立芯片的功耗管理策略作为功耗管理的依据;众核操作系统启动后,将功耗阈值寄存器、功耗预警寄存器均初始化为最大稳定运行功耗;众核芯片操作系统运行时,外部功耗管理系统启动功耗管理过程,将基础功耗表、频率档次表、功耗管理策略通知到各异构众核芯片的操作系统中。
-
-
-
-
-
-
-