面向异构众核处理器的并行离散更新方法

    公开(公告)号:CN112632089A

    公开(公告)日:2021-04-09

    申请号:CN201910904039.9

    申请日:2019-09-24

    Abstract: 本发明公开了一种面向异构众核处理器的并行离散更新方法,包括以下步骤:S1、对地址连续的离散更新数据区进行块划分,并将数据块与从核进行映射,使得每个从核负责其中一个数据块的更新;S2、每个从核将指令执行过程中产生的离散更新请求进行分类,分为需从核自己处理的离散更新请求和需其它从核处理的离散更新请求,并在产生离散更新请求的地方插入相应的处理函数;S3、需从核自己处理的离散更新请求按程序段func1的处理流程进行处理;S4、需其它从核处理的离散更新请求按程序段func2的处理流程进行处理。本发明可以实现较高性能的并行离散更新,并可以处理LDM空间装不下的大数据离散更新问题。

    异构众核数据重用方法
    2.
    发明公开

    公开(公告)号:CN112579089A

    公开(公告)日:2021-03-30

    申请号:CN201910927232.4

    申请日:2019-09-27

    Abstract: 本发明公开了一种异构众核数据重用方法,包括Stencil计算识别模块、块分段任务调度模块和数据重定向模块,所述Stencil计算识别模块完成Stencil计算的识别工作,所述块分段任务调度模块完成当进行stencil优化的维度为循环最外层时,改变任务划分调度的工作,所述数据重定向模块完成数据重用的工作;包括以下步骤:S1、假设同一数组的同一维度为i,由Stencil计算识别模块通过扫描计算中涉及的所有数组下标,识别出同一数组的同一维度是否存在i‑a/i+a这样的下标,且其他本维度下标都在[i‑a,i+a]范围之内,如果是,则认为该维度存在Stencil计算,将该维度作为stencil优化的备选维度,执行下一步。本发明减少主存与高速缓存间的数据传输量,提升程序性能。

    异构众核数据重用方法
    3.
    发明授权

    公开(公告)号:CN112579089B

    公开(公告)日:2022-11-15

    申请号:CN201910927232.4

    申请日:2019-09-27

    Abstract: 本发明公开了一种异构众核数据重用方法,包括Stencil计算识别模块、块分段任务调度模块和数据重定向模块,所述Stencil计算识别模块完成Stencil计算的识别工作,所述块分段任务调度模块完成当进行stencil优化的维度为循环最外层时,改变任务划分调度的工作,所述数据重定向模块完成数据重用的工作;包括以下步骤:S1、假设同一数组的同一维度为i,由Stencil计算识别模块通过扫描计算中涉及的所有数组下标,识别出同一数组的同一维度是否存在i‑a/i+a这样的下标,且其他本维度下标都在[i‑a,i+a]范围之内,如果是,则认为该维度存在Stencil计算,将该维度作为stencil优化的备选维度,执行下一步。本发明减少主存与高速缓存间的数据传输量,提升程序性能。

    一种基于编译指导的众核数据分片方法

    公开(公告)号:CN105487911B

    公开(公告)日:2018-07-06

    申请号:CN201510830718.8

    申请日:2015-11-24

    Abstract: 一种基于编译指导的众核数据分片方法,包括:在加速程序段开始处添加编译指导语句,描述原始数组的多个分片特征;编译器识别编译指导语句,记录原始数组的每个分片信息;对原始数组的各个分片信息,计算该分片的大小,并在局存中申请具有相同大小的相应局存数组;扫描整个加速程序段,检查原始数据的每个引用;如果该引用的数据在当前的分片内,则将原始数组的引用转换成对局存数组的引用;如果该引用是读引用,则在原始数组的分片信息上记录读标志;如果该引用是写引用,则在原始数组的分片信息上记录写标志;如果分片有读标志,在加速段开始处插入该分片的数据导入语句;如果分片有写标志,在加速段开始处插入该分片的数据导出语句。

    指针别名关系判断方法和代码多版本优化方法

    公开(公告)号:CN102981837B

    公开(公告)日:2016-04-13

    申请号:CN201210439950.5

    申请日:2012-11-06

    Abstract: 本发明提供了一种指针别名关系判断方法和代码多版本优化方法。所述指针别名关系判断方法包括:判断第一循环体在执行一次循环操作时所述第一循环体内的第一指针所指向的第一地址段偏移和第二循环体在执行相同次循环操作时第二循环体内的第二指针所指向的第二地址段偏移是否重合,所述第一循环体和第二循环体是根据待优化循环体生成的两个不同版本;判断所述第一循环体在结束上一次循环操作转入下一次循环操作时所述第一指针指向的第一地址段跨步和所述第二循环体在结束上一次循环操作转入下一次循环操作时所述第二指针指向的第二地址段跨步是否相等;以及如果上述两个判断步骤结果均为是,则确定所述第一指针和所述第二指针互为指针别名关系。

    一种寄存器分配方法、系统及处理器

    公开(公告)号:CN102968379B

    公开(公告)日:2015-05-06

    申请号:CN201210410331.3

    申请日:2012-10-24

    Abstract: 本发明实施例提供一种寄存器分配方法、系统及处理器;其中方法基于一种处理器,所述处理器包括:向量寄存器,由至少一个存储器组成的存储器组,和内存,所述存储器组的读取速度快于内存的读取速度;所述方法包括:判断所述向量寄存器中是否存在能够存储当前变量的可用存储空间;若是,在所述可用存储空间中,为当前变量分配对应的存储空间,将所述当前变量保存入所分配的存储空间中;若否,判断所述存储器组中是否存在能够存储当前变量的可用存储空间;若是,依据所述存储器组中各存储器的读取速度,将当前变量保存入存在可用存储空间且读取速度最快的存储器中;若否,将当前变量保存入内存中。本发明减少了保存入内存的变量数量。

    面向异构众核基于空间重排的数据传输方法

    公开(公告)号:CN112416825B

    公开(公告)日:2022-10-04

    申请号:CN201910771644.3

    申请日:2019-08-21

    Abstract: 本发明公开一种面向异构众核基于空间重排的数据传输方法,包括以下步骤:S1、在编译时,为每个加速区建立一张数据传输信息表,此数据传输信息表中包含当前加速区待传输数据的信息;S2、按照数据的传输模式,将待传输的多个数据进行空间重排;S3、在加速区计算开始之前,启动主存数据到局存缓冲区的DMA数据传输,将加速区计算所需的数据,包括读入的数据和读写的数据,从主存一次传输至局存的缓冲区中;S4、在加速区计算完成之后,启动局存缓冲区到主存的DMA数据传输,将加速区需要传输的要写出的数据,包括读写的数据和写出的数据,从局存缓冲区一次传输至主存中。本发明有效降低众核片上局存和主存之间多次数据传输的开销,提升了程序的访存效率和整体性能。

    一种面向众核分布式局存的隐式数据动态重用方法

    公开(公告)号:CN114217811A

    公开(公告)日:2022-03-22

    申请号:CN202110453214.4

    申请日:2021-04-26

    Abstract: 本发明公开一种面向众核分布式局存的隐式数据动态重用方法,包括以下步骤:S1、根据加速计算中的数据访问模式、数据量、以及加速计算核心本地局存的容量,对数据在加速计算核心本地局存中的存放方式分别进行处理;S2、通过“注册编译指示”标记程序中可能重用的数据变量名或数组偏移;S3、创建重用数据的主存地址和局存地址映射表;S4、通过“重用编译指示”指明需要重用的数据变量名或数组偏移;S6、将“重用编译指示”所标记的代码段中对重用数据主存变量的访问做替换处理。本发明既能动态地申请释放,充分利用有限的局存空间,又能使重用数据尽可能长地驻留在局存中,减少数据传输的开销,提高程序的性能。

Patent Agency Ranking