模型优化方法、装置以及计算设备

    公开(公告)号:CN117709403A

    公开(公告)日:2024-03-15

    申请号:CN202211098928.9

    申请日:2022-09-07

    Abstract: 本申请实施例提供了一种模型优化方法,其中,该方法包括:接收用户输入或人工智能AI应用发送的优化请求信息,所述优化请求信息中包括第一模型文件,所述第一模型文件中包括M个算子,每个算子用于执行一个矩阵乘计算,所述每个算子对应一个内核函数,所述M为正整数;根据所述第一模型文件,生成第二模型文件,所述第二模型文件包括N个融合算子,每个融合算子用于执行至少两个矩阵乘计算,所述每个融合算子分别对应一个内核函数,所述N为正整数,且N

Patent Agency Ranking