-
公开(公告)号:CN119720615A
公开(公告)日:2025-03-28
申请号:CN202411940887.2
申请日:2024-12-26
Applicant: 国家电网有限公司信息通信分公司
Abstract: 本申请涉及云计算运维管理领域,公开了基于云环境的运维故障演训与故障场景自动编排系统,包括:故障建模模块、故障预测模块、故障编排模块、脚本执行模块和复盘优化模块;故障建模模块对云平台的组件状态及故障传播路径进行建模,生成故障场景模型;故障预测模块计算故障传播路径的概率,动态确定最优的故障触发路径;故障编排模块自动生成容器化故障编排脚本;脚本执行模块执行故障编排脚本,触发故障;复盘优化模块基于故障演练过程的数据生成复盘报告。本发明通过自动化故障建模、动态预测、脚本编排与复盘优化,提高了故障演练的准确性与效率,适用于复杂、多组件的云环境运维故障模拟与演训需求。
-
公开(公告)号:CN119718754A
公开(公告)日:2025-03-28
申请号:CN202411940921.6
申请日:2024-12-26
Applicant: 国家电网有限公司信息通信分公司
Abstract: 本申请涉及云计算与分布式系统领域,公开了基于微服务架构的云平台故障原子组件库构建方法,包括以下步骤:将云平台功能模块拆解为多个独立的微服务,并设计故障原子组件库;通过故障检测组件,实时监控微服务的运行状态,采集故障数据并将故障状态输入故障诊断组件;采用马尔可夫决策过程对故障状态进行建模;基于预设的奖励函数,确定最优故障恢复策略;根据所述最优恢复策略,动态调用故障原子组件库中的一个或多个组件,执行故障恢复动作;通过监控故障恢复的执行结果,反馈故障状态转移信息。本发明能够实现云平台故障的快速检测、精准诊断和高效恢复,动态适应故障变化,提升系统的高可用性、自愈能力和资源利用效率。
-