-
公开(公告)号:CN119476379A
公开(公告)日:2025-02-18
申请号:CN202411414343.2
申请日:2024-10-10
Applicant: 鹏城实验室
Abstract: 本申请实施例公开一种数据处理方法、装置、计算机设备及存储介质,神经网络处理器包括全局内存、中转缓存区和多个计算单元,通过对待更新矩阵进行分块处理得到多个待更新子矩阵,并将多个待更新子矩阵均衡分配给每个计算单元;在第一矩阵中确定出每个待更新子矩阵对应的第一子矩阵,将第一子矩阵从全局内存中搬运至每个待更新子矩阵对应的计算单元的预设缓存区;在第二矩阵中确定每个待更新子矩阵对应的第二子矩阵,将第二子矩阵从全局内存中搬运至中转缓存区;从预设缓存区中获取目标第一子矩阵,从中转缓存区中获取目标第二子矩阵;通过计算单元对每个待更新子矩阵、目标第一子矩阵和目标第二子矩阵进行通用矩阵乘运算,得到更新子矩阵。
-
公开(公告)号:CN116627433B
公开(公告)日:2024-01-09
申请号:CN202310881075.4
申请日:2023-07-18
Applicant: 鹏城实验室
Abstract: 本申请提供了一种AI处理器实时的参数预测方法、系统、设备及介质,属于人工智能技术领域。方法包括:在AI处理器上运行目标应用程序,在建模阶段,采集AI处理器运行过程中的基本参数;实时通过AI处理器对应的非侵入式调节工具调节基本参数,并在实时调节过程中获取各个基本参数对应的目标运行参数;基于多个目标运行参数与对应的基本参数进行拟合操作,建立由基本参数映射到目标运行参数的函数模型;在预测阶段,获取实时的基本参数,并将实时的基本参数输入到函数模型中,得到预测的目标运行参数,以根据预测的目标运行参数确定参数预测结
-
公开(公告)号:CN117216466A
公开(公告)日:2023-12-12
申请号:CN202311111058.9
申请日:2023-08-30
Applicant: 鹏城实验室
Abstract: 本申请公开了一种数据处理方法、装置、系统及存储介质,涉及人工智能芯片技术领域,包括:获取待求解矩阵,其中,待求解矩阵与三角矩阵、预设矩阵构建得到三角矩阵方程的等式,且待求解矩阵与三角矩阵位于等式的一边,预设矩阵位于等式的另一边;对三角矩阵进行逆变换得到逆三角矩阵;根据人工智能芯片的矩阵运算的第一浮点数精度、待求解矩阵要求的运算精度,对逆三角矩阵、预设矩阵进行精度处理,得到逆三角矩阵对应的第一矩阵、预设矩阵对应的第二矩阵;将第一矩阵和第二矩阵输入到矩阵计算单元,得到矩阵相乘结果,其中,矩阵相乘结果用以表示待求解矩阵。本申请能够显著提升数据处理效率。
-
公开(公告)号:CN119322912A
公开(公告)日:2025-01-17
申请号:CN202411824110.X
申请日:2024-12-12
Applicant: 鹏城实验室
Abstract: 本申请实施例提出的并行计算设备的矩阵运行处理方法及相关设备,方法包括:获取第一待乘矩阵的第一矩阵维度和第二待乘矩阵的第二矩阵维度;获取中间分块参数,并生成行分块参数和列分块参数;基于中间分块参数、行分块参数和列分块参数计算得到分块数据占用量,并迭代更新中间分块参数;基于行矩阵参数、行分块参数、列矩阵参数和列分块参数计算得到分块运算任务数,并迭代更新行分块参数和列分块参数;最后,基于中间分块参数、行分块参数和列分块参数对第一待乘矩阵和第二待乘矩阵进行矩阵分块,以执行矩阵乘法运算,有效的利用并行计算设备的并行计算资源,提高了在并行计算设备中进行矩阵运算的数据处理可靠性。
-
公开(公告)号:CN119249052A
公开(公告)日:2025-01-03
申请号:CN202411336993.X
申请日:2024-09-24
Applicant: 鹏城实验室
Abstract: 本申请实施例提出的并行计算硬件中矩阵运算的数据处理方法及相关设备,方法包括:首先,获取第一单精度矩阵的第一半精度矩阵和第二单精度矩阵的第二半精度矩阵、第二单精度矩阵与第二半精度矩阵之间的第二误差矩阵、第二误差矩阵中的多个第二分块误差矩阵,并存储至并行计算硬件的L1缓冲区中;逐一获取第一半精度矩阵中第一分块矩阵,存储至L1缓冲区中,并进一步进行矩阵运算得到第一结果矩阵,获取第二结果矩阵和第三结果矩阵,累加第一结果矩阵、第二结果矩阵以及第三结果矩阵得到单精度目标矩阵,并将单精度目标矩阵作为第一单精度矩阵和第二单精度矩阵进行矩阵乘法运算的结果,有效地提高了单精度矩阵乘法的精准度和计算速率。
-
公开(公告)号:CN116627433A
公开(公告)日:2023-08-22
申请号:CN202310881075.4
申请日:2023-07-18
Applicant: 鹏城实验室
Abstract: 本申请提供了一种AI处理器实时的参数预测方法、系统、设备及介质,属于人工智能技术领域。方法包括:在AI处理器上运行目标应用程序,在建模阶段,采集AI处理器运行过程中的基本参数;实时通过AI处理器对应的非侵入式调节工具调节基本参数,并在实时调节过程中获取各个基本参数对应的目标运行参数;基于多个目标运行参数与对应的基本参数进行拟合操作,建立由基本参数映射到目标运行参数的函数模型;在预测阶段,获取实时的基本参数,并将实时的基本参数输入到函数模型中,得到预测的目标运行参数,以根据预测的目标运行参数确定参数预测结果。本申请可以在AI处理器上在线部署运行,无需额外的计算资源,预测的结果可靠性高。
-
公开(公告)号:CN113887730A
公开(公告)日:2022-01-04
申请号:CN202111040089.0
申请日:2021-09-06
Applicant: 鹏城实验室
IPC: G06N10/00
Abstract: 本发明公开了一种量子模拟器实现方法、装置、相关设备以及量子模拟方法,其中,上述量子模拟器实现方法包括:构建量子比特门算子,其中,上述量子比特门算子用于基于量子门的操作位对目标设备中的数据进行搬运并进行态矢量更新;构建量子模拟器,其中,上述量子模拟器中包括上述量子比特门算子,上述量子模拟器是实现量子线路模拟的软件包;将上述量子模拟器部署到上述目标设备中,上述目标设备为昇腾AI处理器。与现有技术相比,本发明方案中获取可以对昇腾AI处理器中的数据进行搬运并进行态矢量更新的量子比特门算子,并根据量子比特门算子获取能部署到昇腾AI处理器中运行的量子模拟器,从而有利于充分利用昇腾AI处理器的计算能力实现量子模拟。
-
-
-
-
-
-