深度学习模型的训练方法、装置、终端、及存储介质

    公开(公告)号:CN115936103A

    公开(公告)日:2023-04-07

    申请号:CN202211525392.4

    申请日:2022-12-01

    Abstract: 本发明公开了一种深度学习模型的训练方法、装置、终端及存储介质,先获取深度学习模型中每个网络层的第一矩阵和第二矩阵;根据第三矩阵,确定第一矩阵的逆矩阵、第二矩阵的逆矩阵;第一矩阵由反向传回来的损失函数值对各网络层非线性映射之前输出的梯度的期望值组成;第二矩阵由各网络等的上一层非线性之后的输出的期望值组成;第三矩阵为第一预设可调参数与预设单位矩阵的乘积;第一矩阵的逆矩阵为第三矩阵与第一矩阵的差值;第二矩阵的逆矩阵为第三矩阵与第二矩阵的差值;基于第一矩阵和第二矩阵的最大特征值、逆矩阵,确定网络层的逆矩阵,以得到深度学习模型的Fisher信息矩阵的逆矩阵对深度学习模型进行训练,极大地减少模型训练的计算资源。

    一种基于AI处理器的数据处理方法和数据处理装置

    公开(公告)号:CN115629872A

    公开(公告)日:2023-01-20

    申请号:CN202211201027.8

    申请日:2022-09-28

    Abstract: 本发明涉及数据处理技术领域,具体是涉及一种基于AI处理器的数据处理方法和数据处理装置。本发明首先将数据处理所需要的各个程序依据其是否涉及矩阵乘划分为主程序和副程序,由于AI处理器适用于处理矩阵乘程序,因此将涉及矩阵乘的主程序放在AI处理器执行以充分利用AI处理器的计算资源,而将不涉及矩阵乘的副程序放在副处理器执行以避免其占用AI处理器的计算资源。本发明的副处理器和AI处理器协同工作,能够降低计算机执行数据处理程序所需的时间。另外,本发明的AI处理器和副处理器异构并行执行分配给各自的程序,异构并行执行即两个处理器同时执行分配给各自的程序,从而进一步降低了计算机执行数据处理程序所需的时间。

    一种奇异值分解运算实现方法、装置以及相关设备

    公开(公告)号:CN113885941A

    公开(公告)日:2022-01-04

    申请号:CN202111040096.0

    申请日:2021-09-06

    Abstract: 本发明公开了一种奇异值分解运算实现方法、装置以及相关设备,其中,上述奇异值分解运算实现方法包括:构建奇异值分解算子,其中,上述奇异值分解算子用于对目标设备中的数据进行搬运并进行奇异值分解运算;将上述奇异值分解算子部署到上述目标设备中,其中,上述目标设备为昇腾AI处理器;获取待处理数据,基于部署后的奇异值分解算子对上述待处理数据进行奇异值分解运算。与现有技术相比,本发明方案中构建可以对昇腾AI处理器中的数据进行搬运并进行奇异值分解运算的奇异值分解算子,并将奇异值分解算子部署到昇腾AI处理器中,有利于充分利用昇腾处理器的计算能力,直接基于昇腾AI处理器对待处理数据进行SVD运算。

Patent Agency Ranking