-
公开(公告)号:CN113742125A
公开(公告)日:2021-12-03
申请号:CN202111042013.1
申请日:2021-09-06
Applicant: 中国工程物理研究院计算机应用研究所
IPC: G06F11/07
Abstract: 本发明公开了一种轻量级高通量计算模式及其容错方法,具体涉及计算机应用技术领域,包括以下步骤:步骤一:提出一种运行时高通量计算模式;步骤二;提出一种基于阈值的错误判别方法;步骤三:计一个高通量计算容错技术框架,可实现数千上万通量计算的高效容错。设计了父子任务关系模型,降低了超大规模并发计算任务的管理开销;本发明通过针对数千上万通量并发的计算模式,提出了运行时高通量任务模型,以动态扩展任务的形式,设计了父子任务关系模型,降低了超大规模并发计算任务的管理开销;通过作业数组的任务打包技术,降低与超算调度系统交互频率,进一步减小了作业投递以及作业状态监控的开销。