基于异构众核处理器的卷积计算数据重用方法

    公开(公告)号:CN112559197A

    公开(公告)日:2021-03-26

    申请号:CN201910852525.0

    申请日:2019-09-10

    Abstract: 本发明公开一种基于异构众核处理器的卷积计算数据重用方法,CPU通过数据块A和数据块B完成数据块C的卷积计算,包括以下步骤:S1、根据异构众核处理器的内核数,二维映射成N*N个,将数据块A、数据块B、数据块C划分为N*N块,第(i,j)号内核将第(j,i)块数据从内存读取到自己的片上存储器内,数据块C(i,j)的卷积计算需要数据块A(i,k)和数据块B(k,j),其中k=1,2,……,N;S2、进入循环k,循环次数从1到N,共N次,利用得到的数据块A、数据块B完成数据块C的第K次卷积计算。本发明显著降低卷积计算在异构众核处理器上的内存访存需求,充分发挥众核计算能力,从而实现卷积计算高性能,提升其在异构众核处理器上的计算性能。

    基于序列号机制的消息保序方法

    公开(公告)号:CN112448898A

    公开(公告)日:2021-03-05

    申请号:CN201910799268.9

    申请日:2019-08-28

    Abstract: 本发明公开一种基于序列号机制的消息保序方法,包括以下步骤:S1、每进行一次异步消息发送操作时,发送端将当前的发送序列号打包入包头,并将发送序列号加1;S2、接收端每成功接收一次异步消息,将当前的接收序列号和包头中携带的发送序列号进行比对;S3、成功处理按序到达的消息请求后,将接收端的消息序列号生成器的值加1,并对乱序到达队列内的元素查找是否有匹配当前接收序列号的元素;S4、如果认定为一次异步消息的乱序到达,将该次接收完成的消息缓冲区加入乱序到达队列,待后续消息到达并更新接收序列号后进行处理。本发明既可以有效保证通信通路的并发,也可以有效解决底层互连架构带来的消息序问题,同时序列号生成及匹配对于性能的影响非常小。

    一种动静结合的多策略通信支撑方法

    公开(公告)号:CN109101349A

    公开(公告)日:2018-12-28

    申请号:CN201810928724.0

    申请日:2018-08-15

    Abstract: 本发明公开一种动静结合的多策略通信支撑方法,包括:将全局进程组按照设定的分块大小划分全连接区;初始化过程中,在全连接区内每个进程均建立和其他进程间的通信通路,全连接区之间按照对应进程关系建立通信通路,建立虚拟连接时静态分配发送队列和接收队列资源;初始化结束后,程序执行过程中,当出现跨区域无连接进程间通信时,采用动态转发或本地计算方式传递请求并交换队列信息,建立通信通路。本发明采用静态分区和动态转发相结合的通信通路管理策略,在提升通信支撑环境可扩展性的同时,避免了连接管理线程对用户进程产生的不良影响;分层次的集合通信实现可以有效支撑复杂的集合通信需求,提升了集合通信的可扩展性。

    一种基于扁平化模型的通信实现方法

    公开(公告)号:CN105282017B

    公开(公告)日:2018-07-06

    申请号:CN201510831796.X

    申请日:2015-11-24

    Abstract: 本发明提供了一种基于扁平化模型的通信实现方法,可用于点对点通信和集合通信。所述方法包括:运算核心将用户消息的描述符在内存中进行组装;所述运算核心通过写内存方式,将描述符地址信息作为消息请求通知给控制核心;所述控制核心通过创建轮询线程的方式,查询运算核心的消息请求,通过消息请求中携带的描述符地址信息,取出描述符进行消息匹配;所述控制核心利用消息匹配的结果与远程控制核心进行消息通信。

    一种基于物理位置感知的集合通信方法

    公开(公告)号:CN105391658A

    公开(公告)日:2016-03-09

    申请号:CN201510830368.5

    申请日:2015-11-24

    CPC classification number: H04L49/109 H04L49/25

    Abstract: 本发明提供了一种基于物理位置感知的集合通信方法,包括:感知目的进程的位置;在目的进程和位于同一物理芯片内时,通过查询确定本地运算核心是否空闲;在本地运算核心空闲的情况下,通过本地运算核心发起存储器直接访问操作,将通信数据直接写入所述同一物理芯片上的目的进程主存中,以使得所述同一物理芯片内的通信不需要再通过网络接口进行中转。本发明进行大规模集合通信时,通过感知目的进程的位置,结合路由芯片路由算法,根据无端口冲突原则,使得通信间的路由冲突最小化。

    基于异构众核处理器的多级访存方法、离散访存方法

    公开(公告)号:CN102929724A

    公开(公告)日:2013-02-13

    申请号:CN201210441328.8

    申请日:2012-11-06

    Abstract: 本发明公开了一种基于异构众核处理器的多级访存方法及离散访存方法。所述多级访存方法包括:从核读入第一次计算所需的数据;除第一次之外,从核在进行本次数据计算的同时,读入下一次计算所需的数据;除最后一次之外,从核在进行本次数据计算的同时,写回上一次计算结果数据;从核写回最后一次计算结果数据。所述离散访存方法包括:在从核上调整数组的存储顺序,将离散存储的数组调整为连续存储的数组;从核以多级访存方法,对所述数组进行通信读入数据、计算和通信写回数据。本发明实现了有效计算开销和多级存储资源访问开销之间最大限度的隐藏,提高了多级访存效率,充分发挥了从核的性能效率,从而提高科学计算课题的计算效率。

Patent Agency Ranking