基于故障数据建模的HPC可靠性评估方法

    公开(公告)号:CN112445632A

    公开(公告)日:2021-03-05

    申请号:CN201910831168.X

    申请日:2019-09-04

    Abstract: 本发明公开一种基于故障数据建模的HPC可靠性评估方法,包括以下步骤:对目标系统的所有故障单元,进行故障数据采集;基于故障严重等级,对采集到的故障数据进行故障分类,将故障数据分为严重故障数据与非严重故障数据;筛除与失效无关的非严重故障数据;选定时间区间,将该时间区间内的所有严重故障数据作为采样样本,采用最大似然估计法,计算weibull分布参数,获得该时间区间内的目标系统的失效时间分布模型;计算时间区间上的目标系统的MTTF,即weibull分布的特征值;根据不同时间区间的目标系统的MTTF变化,评估目标系统的可靠性变化特征。本发明能够真实反映系统运行中的可靠性指标,可以在线分析出系统在不同时间段的可靠性水平,指导系统容错和日常运维。

    计算节点功耗感知方法
    32.
    发明公开

    公开(公告)号:CN112395150A

    公开(公告)日:2021-02-23

    申请号:CN201910764228.0

    申请日:2019-08-19

    Abstract: 本发明公开一种计算节点功耗感知方法,包括以下步骤:运行带外系统;数据感知和登记程序模块周期性调用数据感知与转换模块,以获取节点的功耗数据;数据感知与转换模块读取传感器的原始电压、电流数据,并将来自传感器的原始电压、电流数据转换为节点的功耗数据;数据感知和登记程序模块将从数据感知与转换模块获取的功耗数据写入带内系统CPU的寄存器;数据感知和登记程序模块等待时间T后,转入步骤二,依此循环;当带外系统需要获取节点功耗数据时,功耗查询接口调用数据感知与转换模块,获取节点功耗数据。本发明解决了现有的计算机节点功耗数据感知方法高度依赖带内外网络传输、时效差、代价高、数据不完整的问题。

    一种面向异构众核芯片的量化功耗控制方法

    公开(公告)号:CN105487634A

    公开(公告)日:2016-04-13

    申请号:CN201510828279.7

    申请日:2015-11-24

    CPC classification number: G06F1/3287

    Abstract: 一种面向异构众核芯片的量化功耗控制方法,包括:获取异构众核芯片在每种状态下的基准功耗数据,建立外部的基础功耗数据表;获取异构众核芯片所支持的所有稳定运行频率的频率档次表;而且针对所有稳定运行频率建立不同频率下运行相同应用代码的芯片功耗存在关系,其中,频率越高,功耗越大,并且最低频率档次工作功耗一定小于最大稳定运行功耗;建立芯片的功耗管理策略作为功耗管理的依据;众核操作系统启动后,将功耗阈值寄存器、功耗预警寄存器均初始化为最大稳定运行功耗;众核芯片操作系统运行时,外部功耗管理系统启动功耗管理过程,将基础功耗表、频率档次表、功耗管理策略通知到各异构众核芯片的操作系统中。

Patent Agency Ranking