-
公开(公告)号:CN118261267A
公开(公告)日:2024-06-28
申请号:CN202410389615.1
申请日:2024-04-02
Applicant: 国家气象信息中心(中国气象局气象数据中心)
Abstract: 本发明公开支撑气象数据分析建模的人工智能平台的双集群架构和设计方法,包括位于本地机房的服务集群和位于异地机房的跨云算力集群;服务集群和算力集群间通过API接口实现互通,且本地中心机房的服务器的架构与异地机房的跨云服务器的架构不同。服务集群确保平台入口、平台和用户数据均位于中心机房,保障系统的安全性;算力集群可接入异地机房中的不同规格ARM服务器,支持CPU/GPU的物理/云虚拟机等,将服务器纳入资源池统一调度,只提供算力,不保存平台和用户数据,支持节点伸缩,保证了可插拔性。本发明有效解决跨云异构应用特性带来的集群间Pod无法通信和无法调度跨云异构资源问题。
-
公开(公告)号:CN119621312A
公开(公告)日:2025-03-14
申请号:CN202411679994.4
申请日:2024-11-22
Applicant: 国家气象信息中心(中国气象局气象数据中心)
Abstract: 本发明公开一种兼容气象超算架构的多态异构智算资源融合调度方法及系统,包括创建服务集群和计算集群;构建计算集群算力聚合应用服务;创建气象超算架构智算集群融合调度支撑环境;气象超算架构智算集群内构建弹性超算服务;构建适配多态异构智算资源的软件栈支撑环境。本申请组建服务集群基于融合调度器Kubernetes调度组件调度计算集群,采用容器技术调度适配异构资源,基于气象超算架构智算集群队列管理软件接口,实现基于融合调度器Slurm调度组件调度,实现超算架构智算集群原生作业调度,采用弹性超算容器技术,构建适配超算架构智算算力及软件栈分布式环境;形成融合统一调度技术,实现统一高效调度利用,提升资源利用效率。
-