-
公开(公告)号:CN119987974A
公开(公告)日:2025-05-13
申请号:CN202510445993.1
申请日:2025-04-10
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明涉及计算机深度学习技术领域,特别涉及一种深度学习任务混合部署方法及系统。其方法包括:S1.用户通过Kubernetes原生接口提交任务;S2.任务调度优化器根据资源需求和服务等级分析任务并分配至合适节点;S3.SLO管理器跟踪系统各项性能指标的实时数据,并将实时数据与预先设定的服务等级目标进行对比;S4.Koordlet组件在目标节点上执行具体的资源分配操作;S5.流量安全监控器对各节点之间的数据流进行实时监测。本发明通过分析深度学习任务资源使用的周期性规律,提出针对不同类型资源的混合部署的策略,实现在线与离线任务的动态资源共享,同时确保系统在高负载条件下仍能稳定高效运行。