故障检测方法、装置、计算机设备、存储介质和计算机程序产品

    公开(公告)号:CN119311520A

    公开(公告)日:2025-01-14

    申请号:CN202411405457.0

    申请日:2024-10-09

    Abstract: 本申请涉及一种故障检测方法、装置、计算机设备、存储介质和计算机程序产品,该方法通过接收信息交互集群中多个目标交互节点发送的与管理集群中的主节点进行信息交互的交互状态信息,然后根据各目标交互节点发送的交互状态信息对管理集群中的主节点进行故障检测,得到检测结果。其中,目标交互节点包括代理服务节点或底层服务节点。上述方法中,由于管理集群的对外服务是通过代理服务节点与底层服务节点交互或者直接与底层服务交互实现,所以通过检测代理服务节点或底层服务节点与主节点之间的交互状态,能够准确识别出管理集群是否能够正常对外服务,进而根据管理集群对外服务的状态,能够准确快速地检测出主节点是否发生假死故障。

    故障处理方法、装置、计算机设备、存储介质和程序产品

    公开(公告)号:CN119311459A

    公开(公告)日:2025-01-14

    申请号:CN202411515086.1

    申请日:2024-10-28

    Abstract: 本申请涉及一种故障处理方法、装置、计算机设备、存储介质和程序产品。上述方法包括:确定分布式存储系统中各故障节点的故障类型;在分布式存储系统中存在不同故障类型的故障节点时,采用预设处理策略对各故障节点进行故障处理;预设处理策略包括不同类型故障的处理策略。由于预设处理策略包括不同类型故障的处理策略,因此,针对分布式存储系统中多个服务器节点同时存在多种类型故障的场景,本申请实施例可以采用预设处理策略准确地对各种故障类型的故障节点进行故障处理,无需介入人工进行故障处理,故能够提高分布式存储系统的故障处理效率。

Patent Agency Ranking