基于寄存器间通信的非对齐内存访问加速方法

    公开(公告)号:CN109766208A

    公开(公告)日:2019-05-17

    申请号:CN201910022433.X

    申请日:2019-01-10

    Abstract: 本发明提供的基于寄存器间通信的非对齐内存访问加速方法,属于计算机技术领域,包括:存储在DMA中数据点集沿y方向分隔为m行数据点集行;从核集群的一个x方向的m个从核从DMA中分别读取一行数据点集行;每个从核利用寄存器通信将其读取的数据点集行中的属于相应从核部分的数据通信给相应从核;其中,从核集群的x方向的从核个数为m;m个从核需要读取的数据依次沿x方向排列构成数据点集存储在DMA中。本发明通过分行读取与寄存器间通信相结合的方式,降低了数据的总体访问量,减少非对齐内存访问次数,提升DMA带宽的利用率。

    一种量子张量网络转置和收缩协同的方法和装置

    公开(公告)号:CN115146780B

    公开(公告)日:2023-07-11

    申请号:CN202211045996.9

    申请日:2022-08-30

    Abstract: 本发明公开一种量子张量网络转置和收缩协同的方法和装置,基于异构众核处理器,包括:步骤一:根据读取的张量信息,进行张量索引预分类后分块读入异构众核处理器的计算处理单元;步骤二:在计算处理单元中,根据索引信息,对读入的分块张量进行转置;步骤三:再对经过转置后的张量依据索信息进行张量收缩;步骤四:收缩完成后,将收缩结果输出回处理器的内存对应张量块位置并合成完整的新收缩后张量结果。本发明通过高效的张量分块、转置和张量收缩计算策略,合理地避免了中间结果的冗余访存开销,实现了转置和张量收缩计算一体化、提高了张量收缩的速度,有效解决了张量收缩计算时间长、效率低的问题,提高了大规模量子电路计算模拟的速度。

    一种量子张量网络转置和收缩协同的方法和装置

    公开(公告)号:CN115146780A

    公开(公告)日:2022-10-04

    申请号:CN202211045996.9

    申请日:2022-08-30

    Abstract: 本发明公开一种量子张量网络转置和收缩协同的方法和装置,基于异构众核处理器,包括:步骤一:根据读取的张量信息,进行张量索引预分类后分块读入异构众核处理器的计算处理单元;步骤二:在计算处理单元中,根据索引信息,对读入的分块张量进行转置;步骤三:再对经过转置后的张量依据索信息进行张量收缩;步骤四:收缩完成后,将收缩结果输出回处理器的内存对应张量块位置并合成完整的新收缩后张量结果。本发明通过高效的张量分块、转置和张量收缩计算策略,合理地避免了中间结果的冗余访存开销,实现了转置和张量收缩计算一体化、提高了张量收缩的速度,有效解决了张量收缩计算时间长、效率低的问题,提高了大规模量子电路计算模拟的速度。

    基于生命周期的路径搜索判别、优化方法和装置

    公开(公告)号:CN115130676B

    公开(公告)日:2023-01-24

    申请号:CN202211068175.7

    申请日:2022-09-02

    Abstract: 本发明公开了基于生命周期的路径搜索判别、优化方法和装置,通过不同维度的张量表示各个量子比特和量子门,将量子随机电路转化为张量网络,将张量网络中的张量按维度大小分为主茎张量和分枝张量,采用分枝张量的交换和融合的方式,得到主茎张量树结构和配套的收缩路径优化,完成最终张量网络收缩,张量的维度对应量子门的操作比特数,根据最终张量网络收缩,进行对应量子比特与量子门之间的作用、量子门之间的融合,收缩路径优化包括:读取张量网络收缩路径;遍历路径,判别是否进行分枝张量的交换和枝融合;根据判别结果进行张量网络收缩路径调优;输出调优后的张量网络收缩路径。

    一种量子随机电路的多振幅模拟方法和装置

    公开(公告)号:CN115130675B

    公开(公告)日:2023-01-24

    申请号:CN202211068173.8

    申请日:2022-09-02

    Abstract: 本发明涉及量子随机电路计算模拟技术领域,尤其涉及一种量子随机电路的多振幅模拟方法和装置,该方法包括:步骤一:根据芯片片上存储的最大存储容量以及张量网络收缩路径中每一步张量的最大维数确定进行算子融合的起始位置至结束位置;步骤二:在起始位置,分别将片外存储中的两个张量读取到片上存储并进行相应的转置,再进行融合;步骤三:将融合的结果进行转置后储存,用于在下一位置与所读取后转置的张量进行融合;步骤四:重复上述步骤三,直到算子融合到结束位置,将最终的融合的结果写回到片外存储。本发明可以有效减少片上存储和片外存储之间的数据访问次数,一方面提高多振幅计算模拟的并行度,另一方面提升多振幅计算模拟的效率。

    基于生命周期的路径搜索判别、优化方法和装置

    公开(公告)号:CN115130676A

    公开(公告)日:2022-09-30

    申请号:CN202211068175.7

    申请日:2022-09-02

    Abstract: 本发明公开了基于生命周期的路径搜索判别、优化方法和装置,通过不同维度的张量表示各个量子比特和量子门,将量子随机电路转化为张量网络,将张量网络中的张量按维度大小分为主茎张量和分枝张量,采用分枝张量的交换和融合的方式,得到主茎张量树结构和配套的收缩路径优化,完成最终张量网络收缩,张量的维度对应量子门的操作比特数,根据最终张量网络收缩,进行对应量子比特与量子门之间的作用、量子门之间的融合,收缩路径优化包括:读取张量网络收缩路径;遍历路径,判别是否进行分枝张量的交换和枝融合;根据判别结果进行张量网络收缩路径调优;输出调优后的张量网络收缩路径。

    一种量子随机电路的多振幅模拟方法和装置

    公开(公告)号:CN115130675A

    公开(公告)日:2022-09-30

    申请号:CN202211068173.8

    申请日:2022-09-02

    Abstract: 本发明涉及量子随机电路计算模拟技术领域,尤其涉及一种量子随机电路的多振幅模拟方法和装置,该方法包括:步骤一:根据芯片片上存储的最大存储容量以及张量网络收缩路径中每一步张量的最大维数确定进行算子融合的起始位置至结束位置;步骤二:在起始位置,分别将片外存储中的两个张量读取到片上存储并进行相应的转置,再进行融合;步骤三:将融合的结果进行转置后储存,用于在下一位置与所读取后转置的张量进行融合;步骤四:重复上述步骤三,直到算子融合到结束位置,将最终的融合的结果写回到片外存储。本发明可以有效减少片上存储和片外存储之间的数据访问次数,一方面提高多振幅计算模拟的并行度,另一方面提升多振幅计算模拟的效率。

    基于寄存器间通信的减少冗余读取方法

    公开(公告)号:CN109739678A

    公开(公告)日:2019-05-10

    申请号:CN201910022567.1

    申请日:2019-01-10

    Abstract: 本发明提供的基于寄存器间通信的减少冗余读取方法,属于计算机技术领域,包括从核集群中一个y方向的m个从核分别从存储在DMA中的待计算数据点集的y方向中读取数据;若从核n的相邻从核读取的数据中包含有其y方向的边界数据,则不从DMA中读取被相邻从核包含的y方向的边界数据;从核n与相邻从核通过寄存器通信得到其y方向的边界;从核n从相邻从核读取其边界数据;其中,从核集群中y方向上的从核的个数为m。该发明降低了直接从DMA中读取数据的数据量,减轻了数据计算中的冗余读取的部分,避免了数据浪费,提高了DMA带宽的利用率。

Patent Agency Ranking