目标检测模型训练方法、目标检测方法、装置及设备

    公开(公告)号:CN119851080A

    公开(公告)日:2025-04-18

    申请号:CN202510320886.6

    申请日:2025-03-18

    Abstract: 本申请实施例公开了一种目标检测模型训练方法、目标检测方法、装置及设备。目标检测模型包括图像编码模型、特征编码模型和特征解码模型,通过获取样本图像中的待检测样本对象对应的目标样本区域、目标样本类别及样本描述文本;将样本图像输入到图像编码模型中,输出样本图像中每个子区域对应的区域图像特征;将每个区域图像特征和样本描述文本特征输入到特征编码模型中,输出每个子区域对应的融合特征;将每个子区域对应的融合特征输入特征解码模型中,输出每个子区域对应的目标融合特征;根据每个目标融合特征和样本描述文本确定出待检测样本对象对应的预测类别概率和在样本图像中的预测样本区域;基于预测结果和目标结果对目标检测模型迭代。

    数据处理方法、装置、计算机设备及存储介质

    公开(公告)号:CN119476379A

    公开(公告)日:2025-02-18

    申请号:CN202411414343.2

    申请日:2024-10-10

    Abstract: 本申请实施例公开一种数据处理方法、装置、计算机设备及存储介质,神经网络处理器包括全局内存、中转缓存区和多个计算单元,通过对待更新矩阵进行分块处理得到多个待更新子矩阵,并将多个待更新子矩阵均衡分配给每个计算单元;在第一矩阵中确定出每个待更新子矩阵对应的第一子矩阵,将第一子矩阵从全局内存中搬运至每个待更新子矩阵对应的计算单元的预设缓存区;在第二矩阵中确定每个待更新子矩阵对应的第二子矩阵,将第二子矩阵从全局内存中搬运至中转缓存区;从预设缓存区中获取目标第一子矩阵,从中转缓存区中获取目标第二子矩阵;通过计算单元对每个待更新子矩阵、目标第一子矩阵和目标第二子矩阵进行通用矩阵乘运算,得到更新子矩阵。

    数据处理方法、装置、系统及存储介质

    公开(公告)号:CN117216466A

    公开(公告)日:2023-12-12

    申请号:CN202311111058.9

    申请日:2023-08-30

    Abstract: 本申请公开了一种数据处理方法、装置、系统及存储介质,涉及人工智能芯片技术领域,包括:获取待求解矩阵,其中,待求解矩阵与三角矩阵、预设矩阵构建得到三角矩阵方程的等式,且待求解矩阵与三角矩阵位于等式的一边,预设矩阵位于等式的另一边;对三角矩阵进行逆变换得到逆三角矩阵;根据人工智能芯片的矩阵运算的第一浮点数精度、待求解矩阵要求的运算精度,对逆三角矩阵、预设矩阵进行精度处理,得到逆三角矩阵对应的第一矩阵、预设矩阵对应的第二矩阵;将第一矩阵和第二矩阵输入到矩阵计算单元,得到矩阵相乘结果,其中,矩阵相乘结果用以表示待求解矩阵。本申请能够显著提升数据处理效率。

    并行计算硬件中矩阵运算的数据处理方法及相关设备

    公开(公告)号:CN119249052A

    公开(公告)日:2025-01-03

    申请号:CN202411336993.X

    申请日:2024-09-24

    Abstract: 本申请实施例提出的并行计算硬件中矩阵运算的数据处理方法及相关设备,方法包括:首先,获取第一单精度矩阵的第一半精度矩阵和第二单精度矩阵的第二半精度矩阵、第二单精度矩阵与第二半精度矩阵之间的第二误差矩阵、第二误差矩阵中的多个第二分块误差矩阵,并存储至并行计算硬件的L1缓冲区中;逐一获取第一半精度矩阵中第一分块矩阵,存储至L1缓冲区中,并进一步进行矩阵运算得到第一结果矩阵,获取第二结果矩阵和第三结果矩阵,累加第一结果矩阵、第二结果矩阵以及第三结果矩阵得到单精度目标矩阵,并将单精度目标矩阵作为第一单精度矩阵和第二单精度矩阵进行矩阵乘法运算的结果,有效地提高了单精度矩阵乘法的精准度和计算速率。

    量子模拟器实现方法、装置、相关设备以及量子模拟方法

    公开(公告)号:CN113887730A

    公开(公告)日:2022-01-04

    申请号:CN202111040089.0

    申请日:2021-09-06

    Abstract: 本发明公开了一种量子模拟器实现方法、装置、相关设备以及量子模拟方法,其中,上述量子模拟器实现方法包括:构建量子比特门算子,其中,上述量子比特门算子用于基于量子门的操作位对目标设备中的数据进行搬运并进行态矢量更新;构建量子模拟器,其中,上述量子模拟器中包括上述量子比特门算子,上述量子模拟器是实现量子线路模拟的软件包;将上述量子模拟器部署到上述目标设备中,上述目标设备为昇腾AI处理器。与现有技术相比,本发明方案中获取可以对昇腾AI处理器中的数据进行搬运并进行态矢量更新的量子比特门算子,并根据量子比特门算子获取能部署到昇腾AI处理器中运行的量子模拟器,从而有利于充分利用昇腾AI处理器的计算能力实现量子模拟。

    数据处理方法、装置、计算机可读存储介质及计算机设备

    公开(公告)号:CN117093814A

    公开(公告)日:2023-11-21

    申请号:CN202311054523.X

    申请日:2023-08-21

    Abstract: 本申请实施例公开了一种数据处理方法、装置、计算机可读存储介质及计算机设备。包括:确定当前迭代区内第一子矩阵对应的第一输入矩阵和第二输入矩阵;根据第一输入矩阵和第二输入矩阵确定出第一迭代区内的第一个子迭代区的目标第二子矩阵,第一迭代区和当前迭代区域相邻;根据目标第二子矩阵对第一迭代区内至少一个子迭代区进行迭代,得到对应的第三输入矩阵和第四输入矩阵;根据第一输入矩阵、第二输入矩阵以及第三输入矩阵和第四输入矩阵确定出目标迭代区的目标选定子矩阵,目标迭代区与当前迭代区和第一迭代区均不相邻。从而避免在每个迭代区依次迭代都要对全局内存读写一次,减少对处理器的全局内存的读写次数,充分发挥计算机设备的性能。

    一种基于AI处理器的通用矩阵乘算子的处理方法和装置

    公开(公告)号:CN115185587A

    公开(公告)日:2022-10-14

    申请号:CN202210598490.4

    申请日:2022-05-30

    Abstract: 本发明涉及矩阵处理技术领域,具体是涉及一种基于AI处理器的通用矩阵乘算子的处理方法和装置。依据原矩阵中的设定元素,在CPU上计算出输入矩阵;将所述输入矩阵搬运至所述全局内存;将搬运至所述全局内存的输入矩阵和位于所述全局内存上的矩阵作为通用矩阵乘算子的输入,得到所述通用矩阵乘算子的输出矩阵。本发明在AI处理器上通过通用矩阵乘算子处理矩阵,能够使得AI处理器的计算资源得到充分利用,从而提高了处理矩阵的速度和效率。

    量子模拟器实现方法、装置、相关设备以及量子模拟方法

    公开(公告)号:CN113887730B

    公开(公告)日:2024-08-27

    申请号:CN202111040089.0

    申请日:2021-09-06

    Abstract: 本发明公开了一种量子模拟器实现方法、装置、相关设备以及量子模拟方法,其中,上述量子模拟器实现方法包括:构建量子比特门算子,其中,上述量子比特门算子用于基于量子门的操作位对目标设备中的数据进行搬运并进行态矢量更新;构建量子模拟器,其中,上述量子模拟器中包括上述量子比特门算子,上述量子模拟器是实现量子线路模拟的软件包;将上述量子模拟器部署到上述目标设备中,上述目标设备为昇腾AI处理器。与现有技术相比,本发明方案中获取可以对昇腾AI处理器中的数据进行搬运并进行态矢量更新的量子比特门算子,并根据量子比特门算子获取能部署到昇腾AI处理器中运行的量子模拟器,从而有利于充分利用昇腾AI处理器的计算能力实现量子模拟。

    并行计算硬件中矩阵乘法运算的处理方法及相关设备

    公开(公告)号:CN117370722A

    公开(公告)日:2024-01-09

    申请号:CN202311376164.X

    申请日:2023-10-23

    Abstract: 本申请实施例提供了一种并行计算硬件中矩阵乘法运算的处理方法及相关设备,通过获取第一初始矩阵和第二初始矩阵;然后基于单精度数据类型进行半精度处理,得到第一初始矩阵的第一半精度矩阵,以及第二初始矩阵的第二半精度矩阵;再基于第一初始矩阵和第一半精度矩阵的差值得到第一差值矩阵,以及基于第二初始矩阵和第二半精度矩阵的差值得到第二差值矩阵;最后,累加第一半精度矩阵和第二半精度矩阵的乘积、第一半精度矩阵和第二差值矩阵的乘积以及第二半精度矩阵和第一差值矩阵的乘积,得到第一单精度目标矩阵,从而在仅支持半精度乘法运算的硬件设备上得到一个精准度较高的单精度乘法运算结果。

    基于求逆归一化的模型优化方法、装置、设备和介质

    公开(公告)号:CN117151195A

    公开(公告)日:2023-12-01

    申请号:CN202311050918.2

    申请日:2023-08-18

    Abstract: 本发明提供了一种基于求逆归一化的模型优化方法、装置、设备和介质,方法包括:获取深度神经网络模型,并计算出深度神经网络模型中每个网络层的逆矩阵;根据每个网络层的逆矩阵得到Fisher信息矩阵的逆矩阵和多个中间梯度值;根据多个中间梯度值计算平均梯度项和平均平方项;根据Fisher信息矩阵的逆矩阵对平均平方项进行划分处理,得到每个网络层对应的梯度向量;对每个网络层的梯度向量进行归一化处理,得到单位化平均平方项;根据单位化平均平方项和平均梯度项调整深度神经网络模型中的待优化变量,得到优化后的深度神经网络模型,其中,本申请提供了一种能够在仅增加少量功耗的情况下优化神经网络的训练精度的模型优化方案,以提高模型性能。

Patent Agency Ranking