-
公开(公告)号:CN118245189A
公开(公告)日:2024-06-25
申请号:CN202410412752.2
申请日:2024-04-07
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种进程热迁移方法、装置、电子设备以及存储介质,进程迁移方法包括以下步骤:进程转储步骤:冻结正在进行的进程,获取所述进程的数据为第一数据,将所述第一数据以一组织形式进行准备,流水线压缩所述准备的第一数据后写入镜像文件;进程恢复步骤:获取所述镜像文件中的数据为第二数据,流水线解压缩所述第二数据后恢复至相应位置。本发明的方法通过流水线将压缩的开销隐藏到原有的数据准备、数据处理的过程中,解决了数据压缩占用资源大的问题。
-
公开(公告)号:CN119759357A
公开(公告)日:2025-04-04
申请号:CN202411825773.3
申请日:2024-12-12
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种面向多核并行体系结构的卷积算子编译优化方法和装置。包括:输入转换器模块提取和去重模型中的或者用户输入的卷积参数,并生成卷积描述符组;控制器模块根据历史记录决定是否对输入模块启动调优,将需要调优的卷积描述符传递给调优器模块;调优器模块负责根据配置好的参数空间进行算子的自动调优,输出最佳参数配置;代码生成模块根据接收到的调优参数组合及卷积描述符生成HIP代码,并分别对各个参数生成的核函数进行对应编号。核函数执行模块编译和执行已生成的代码,并通过测试框架对各个核函数的性能进行测试,按编号返回对应的适应度信息并汇总为列表返回给调优器模块。
-
公开(公告)号:CN116861359A
公开(公告)日:2023-10-10
申请号:CN202310643920.4
申请日:2023-06-01
Applicant: 中国科学院计算技术研究所
IPC: G06F18/25 , G06N3/0464 , G06N3/08
Abstract: 本发明提出一种面向深度学习推理任务编译器的算子融合方法,包括:将深度学习推理任务模型的标准模型,转化为初始图级IR;遍历该初始图级IR,将该初始图级IR中的可融合算子标识为同类算子或异类算子;将该初始图级IR转化为张量表达式,融合该张量表达式中的同类算子;将该张量表达式编译为内核源码,融合该内核源码中的异类算子;将该内核源码编译为可执行代码并部署运行。本发明还提出一种面向深度学习推理任务编译器的算子融合系统,以及一种用于深度学习推理任务编译器算子融合的数据处理装置。
-
-