一种量子计算的纠错方法、系统、存储介质及电子设备

    公开(公告)号:CN117933410A

    公开(公告)日:2024-04-26

    申请号:CN202410322527.X

    申请日:2024-03-20

    Abstract: 在本说明书提供的一种量子计算的纠错方法、系统、存储介质及电子设备中,先获取集成芯片中量子芯片输出的计算结果,在集成芯片中,确定与量子芯片对应的存算一体芯片中储存的CSS码的逆矩阵,再根据量子芯片的计算结果,通过CSS码,确定计算结果的症状,然后根据CSS码的逆矩阵以及计算结果的症状,确定计算结果的噪声,最后根据计算结果的噪声,对计算结果纠正,通过在低功耗的集成芯片上运行的分布式算法,高效的得到了量子芯片的正确计算结果。

    面向数据流处理器的数据流图映射方法及系统

    公开(公告)号:CN116302113A

    公开(公告)日:2023-06-23

    申请号:CN202310105230.3

    申请日:2023-02-07

    Abstract: 本发明提出一种面向数据流处理器的数据流图映射方法,包括:获取待执行任务的数据流图及其对应的功耗性能目标,并获取数据流处理器的计算单元总数以及多个数据流图映射策略;预估各数据流图映射策略下该数据流处理器执行该数据流图的功耗性能,从所有数据流图映射策略中选择满足该功耗性能目标的数据流图映射策略作为执行策略;将该数据流图中各个节点指令映射到该数据流处理器中计算单元,以执行该待执行任务,得到执行结果。本发明基于对数据流图的不同映射方案功耗性能的预估,以满足不同功耗性能目标的应用场景。

    一种数据处理的方法、装置、存储介质及电子设备

    公开(公告)号:CN115981870A

    公开(公告)日:2023-04-18

    申请号:CN202310250917.6

    申请日:2023-03-10

    Abstract: 本说明书公开了一种数据处理的方法、装置、存储介质及电子设备。该数据处理的方法包括:获取初始处理模型,并确定初始处理模型中包含的各目标模型算子,针对每个目标模型算子,根据各处理步骤对该模型算子进行拆分,得到该模型算子包含的各子模型算子,根据每个子模型算子和未被拆分的目标模型算子对应的计算顺序,将各子模型算子以及未被拆分的各目标模型算子进行融合,得到至少一个融合算子,根据各融合算子确定优化后处理模型并部署,在接收到数据处理请求后,将获取到的待处理数据输入所述优化后处理模型,以通过所述优化后处理模型对所述待处理数据进行数据处理。

    一种并行训练中的计算方法、装置、存储介质、设备

    公开(公告)号:CN118585342A

    公开(公告)日:2024-09-03

    申请号:CN202411058896.9

    申请日:2024-08-02

    Abstract: 本说明书公开了一种并行训练中的计算方法、装置、存储介质、设备,应用于模型并行训练,模型包括若干模型层,模型层被部署于若干计算节点中,每个计算节点中部署的模型层包括常规层和弹性层,弹性层根据该计算节点的后置节点的常规层确定,针对任一计算节点,根据当前批次的训练样本以及该计算节点上部署的常规层,得到该计算节点的计算结果,若该计算节点的后置节点已完成对前一批次的训练样本的计算,将计算结果作为输出结果,否则,根据计算结果以及该计算节点的弹性层,得到该计算节点的输出结果,将输出结果传输给所述后置节点,可动态监控和调整计算节点的负载,减少整体计算过程的计算等待时间。

    基于softmax的数据处理方法及装置

    公开(公告)号:CN117009729A

    公开(公告)日:2023-11-07

    申请号:CN202311293166.2

    申请日:2023-10-08

    Abstract: 本说明书公开了一种基于softmax的数据处理方法及装置,将目标模型部署在服务器中,通过目标模型的前处理层,确定待处理数据对应的目标矩阵,并通过在服务器上运行归一化层的第一算子,确定该目标矩阵中各行数据分别对应的归一化参数,再通过在服务器上运行第二算子,确定该目标矩阵对应的全局最大值和全局指数和,进而当目标模型的后处理层启动时,通过在服务器上运行融合算子,确定目标矩阵的归一化结果,并根据该归一化结果执行该后处理层对应的数据处理任务。本方法中的服务器不需要对目标矩阵中的数据同时进行处理,即可确定出目标矩阵的全局最大值和全局指数和,减少了对服务器的算力的要求,提高了任务处理效率。

    基于众核处理器多层互联架构的二元运算访存优化方法及装置

    公开(公告)号:CN116185937A

    公开(公告)日:2023-05-30

    申请号:CN202211509617.7

    申请日:2022-11-29

    Abstract: 一种基于众核处理器多层互联架构的二元运算访存优化方法,包括:检查第二类核间的计算任务是否存在可重用的计算数据以及需要加载的数据批次数;确定每一次计算迭代时,每个第二类核所分配的计算数据;第一轮计算时,所有第二类核的计算数据通过DMA从主存获取到第二类核LDM中;第2~N轮计算,根据访存优化的策略,计算数据通过RMA从第二类核组内其他第二类核的LDM中获取,然后进行计算;此前2个步骤重复次;第轮计算,计算数据通过DMA从主存获取到第二类核的LDM中,然后进行计算;第轮计算,计算数据通过RMA从第二类核组内其他第二类核的LDM中获取,然后进行计算;结束计算,将上一轮计算的结果通过DMA写回主存。

    基于DMA传输的卷积网络Padding预处理装置及方法

    公开(公告)号:CN116258177A

    公开(公告)日:2023-06-13

    申请号:CN202310131550.6

    申请日:2023-02-06

    Abstract: 本发明提出一种基于DMA传输的卷积网络Padding预处理方法和系统,包括:在DMA传输过程中实现数据读取并实现对图片或卷积得到的特征向量进行Padding处理。本发明通过在DMA传输过程中,通过专用的处理逻辑对Padding进行高速的流式处理。避免了采用CPU或其它计算单元采用指令操作的方式,可以显著提高数据Padding的效率,提供神经网络整体执行效率;显著减少数据搬运次数,提高执行效率。

    一种高分辨率遥感图像的目标检测方法及装置

    公开(公告)号:CN114581781A

    公开(公告)日:2022-06-03

    申请号:CN202210480814.4

    申请日:2022-05-05

    Abstract: 本发明公开了一种高分辨率遥感图像的目标检测方法及装置,该方法包括:从传感器获取原始高分辨率遥感图像;从历史检测结果中获取原始高分辨率遥感图像所对应区域以及所述区域向四周扩展预定距离的扩展区域内的目标信息;根据目标信息,对原始高分辨率遥感图像进行自适应的图像分区,得到不同的簇侯检区,进而得到必检区和非必检区;进行必检区的模型选择,生成必检区的目标检测方案;执行目标检测方案,得到必检区的检测结果;判断计算平台是否有多余计算资源以检测非必检区,若有,则进行非必检区的动态分区检测,得到非必检区的检测结果,将必检区的检测结果和非必检区的检测结果合并为目标检测结果,否则将必检区的检测结果作为目标检测结果。

    一种并行训练中的计算方法、装置、存储介质、设备

    公开(公告)号:CN118585342B

    公开(公告)日:2024-11-05

    申请号:CN202411058896.9

    申请日:2024-08-02

    Abstract: 本说明书公开了一种并行训练中的计算方法、装置、存储介质、设备,应用于模型并行训练,模型包括若干模型层,模型层被部署于若干计算节点中,每个计算节点中部署的模型层包括常规层和弹性层,弹性层根据该计算节点的后置节点的常规层确定,针对任一计算节点,根据当前批次的训练样本以及该计算节点上部署的常规层,得到该计算节点的计算结果,若该计算节点的后置节点已完成对前一批次的训练样本的计算,将计算结果作为输出结果,否则,根据计算结果以及该计算节点的弹性层,得到该计算节点的输出结果,将输出结果传输给所述后置节点,可动态监控和调整计算节点的负载,减少整体计算过程的计算等待时间。

Patent Agency Ranking