并行计算中作业启动数据压缩传递方法

    公开(公告)号:CN112398750A

    公开(公告)日:2021-02-23

    申请号:CN201910764215.3

    申请日:2019-08-19

    Abstract: 本发明公开一种并行计算中作业启动数据压缩传递方法,包括以下步骤:S11、启动作业,获取需要发送至运行该作业任务的计算资源的全数据信息;S12、将全数据信息压缩为删减了重复共性信息的属性数据信息;S2、将属性数据信息压缩为通过单独的格式化语句描述的格式数据信息;S3、获得压缩后的,用于发送至计算资源的传输数据信息;S4、对传输数据信息进行对应于通用压缩算法的通用解压缩和反向数据解析,获得原始的全数据信息;S5、计算资源各自的作业程序将获得的全数据信息进行本地存储,当计算资源需要数据信息时,可直接通过本地读取。本发明解决了大规模作业启动过程中信息传递量大、时间长的问题,提高了大规模作业启动的效率,并有效缓解了网络压力。

    一种基于差异识别的并行系统局部迁移容错方法

    公开(公告)号:CN105468457B

    公开(公告)日:2019-04-09

    申请号:CN201510830319.1

    申请日:2015-11-24

    Abstract: 一种基于差异识别的并行系统局部迁移容错方法包括:系统启动并行作业迁移容错并申请新的资源用于作业迁移;作业管理进行迁移前准备;并行文件系统进行飞行数据驱赶及状态保留;并行语言库进行消息驱赶及任务同步;并行语言库提取出需要迁移的关键信息,并通知到系统核心,并通知作业管理作业任务已经做好迁移准备;作业管理调用系统核心接口进行作业任务迁移,系统核心仅仅将系统核心状态与作业任务进程信息传送到目标节点,并恢复包含关键信息的作业任务进程;在目标节点,并行文件系统根据迁移前记录的描述符再次打开对应的文件,恢复文件环境,并行语言根据系统核心恢复的关键信息,恢复作业运行环境;作业管理重构作业,恢复作业的继续运行。

Patent Agency Ranking