-
公开(公告)号:CN117493017A
公开(公告)日:2024-02-02
申请号:CN202311607304.X
申请日:2023-11-28
Applicant: 中国人民解放军国防科技大学
Abstract: 本发明公开了一种面向神经网络作业优化的内存分配方法,通过修改Tensor的基类的数据结构;使用分块布局实例化神经网络模型的参数对象;初始化并同步参数对象的所有副本;判断神经网络模型的所有参数是否完成初始化;若识别到所有参数完成初始化时,则实例化中间结果对象;判断中间结果是否从第一维进行划分;若识别到中间结果从第一维进行划分时,则将原来Tensor对象的内存区修改为分块布局;判断任务划分是否使用静态调度策略;若识别到任务划分使用静态调度策略时,则顺序分配子任务到子线程并将子数据对应到NUMA节点上;将对应到一个NUMA节点的所有子数据作为一个分块分配内存。本发明稳定提升神经网络作业的执行效率。