一种异构众核架构上基于算子融合的数据复用方法

    公开(公告)号:CN114239669A

    公开(公告)日:2022-03-25

    申请号:CN202110398219.1

    申请日:2021-04-14

    Abstract: 本发明公开一种异构众核架构上基于算子融合的数据复用方法,将DNN算子库中依次调用的至少两个算子A、B进行功能融合,获得融合算子C,执行以下操作:S1、融合算子C从主存中读取数据到局存中,并将读取的数据作为算子A的输入;S2、算子A将获取的数据作为输入,进行相应的运算,完成算子A的功能计算,此时算子A将结果保留在局存中不写回主存;S3、算子A将局存中的计算结果传递给算子B,作为算子B的输入;S4、算子B将来自算子A的数据作为输入;S5、算子B完成运算后,将最终的计算结果从局存写回主存;S6、算子C运算结束。本发明极大减少了内存访问次数,提高了数据的复用率,综合提升了可融合算子的效率。

    基于MPI的软件消息重传容错方法

    公开(公告)号:CN112445627A

    公开(公告)日:2021-03-05

    申请号:CN201910826408.7

    申请日:2019-09-03

    Abstract: 本发明公开一种基于MPI的软件消息重传容错方法,基于MPI消息库,包括以下步骤:S1、消息发送方发起消息发送操作,并发起对消息接收方网络接口的请求(Req);S2、接收方接收来自发送方的请求和/或消息数据后,发送一个消息应答(Ack)给消息发送方;S3、消息发送方收到来自消息接收方的消息应答(Ack),确认消息发送成功,否则,进入S4;S4、位于消息发送方的消息容错处理模块向消息接收方发起针对消息的查询请求;S5、位于消息接收方的消息容错处理模块查询本地与该消息相关的硬件资源,并将查询结果返回给发送方;S6、消息发送方根据查询结果,确定是否重传消息。本发明通过查询/应答协议确认消息丢包错误,使用消息重传实现容错,为网络通信容错提供支持,且对用户透明。

    一种低延迟旁路的消息优化方法

    公开(公告)号:CN109117288A

    公开(公告)日:2019-01-01

    申请号:CN201810928707.7

    申请日:2018-08-15

    Abstract: 本发明公开一种低延迟旁路的消息优化方法,该方法采用旁路方式,对于满足一定长度要求的用户消息请求,采用快速旁路方式处理,减少用户函数到底层消息操作的调用层次;同时,不在通信支撑环境中对用户消息数据以及包头进行组包操作,而是将这些信息直接写入网络接口芯片的短快消息通路条目中,减少硬件读取描述符并访问用户数据的传输启动开销。本发明能够充分利用底层硬件的短快消息通路,在降低硬件处理开销的同时,从软件层面尽量减少消息数据的启动和处理开销,有效降低短消息通信延迟。

    面向大规模并发通信的优化方法

    公开(公告)号:CN112532539B

    公开(公告)日:2023-03-28

    申请号:CN201910879920.8

    申请日:2019-09-18

    Abstract: 本发明公开一种面向大规模并发通信的优化方法,包括以下步骤:S1、发送方向接收方发起发送请求,设置完成计数器初值;S2、接收方收到来自于发送方的发送请求后,匹配相关接收请求信息,向发送方应答目的地址信息;S3、发送方收到来自于接收方的请求应答后,投递拆分后的前n个传输请求;S4、如果探查到某一个传输请求完成,则将完成计数器的值减1,并判断当前完成计数器的值是否为0,如果为0,向发送方投递完成通知,否则,继续补充后续传输请求;S5、接收方收到来自于接收方的完成通知,置接收操作完成。本发明解决了网络资源竞争导致的性能干扰问题和并发通信的性能可扩展性问题,可有效增强并发通信优化手段的灵活性,提升大规模并发通信性能。

    一种低延迟旁路的消息优化方法

    公开(公告)号:CN109117288B

    公开(公告)日:2022-04-12

    申请号:CN201810928707.7

    申请日:2018-08-15

    Abstract: 本发明公开一种低延迟旁路的消息优化方法,该方法采用旁路方式,对于满足一定长度要求的用户消息请求,采用快速旁路方式处理,减少用户函数到底层消息操作的调用层次;同时,不在通信支撑环境中对用户消息数据以及包头进行组包操作,而是将这些信息直接写入网络接口芯片的短消息通路条目中,减少硬件读取描述符并访问用户数据的传输启动开销。本发明能够充分利用底层硬件的短消息通路,在降低硬件处理开销的同时,从软件层面尽量减少消息数据的启动和处理开销,有效降低短消息通信延迟。

    面向大规模并发通信的优化方法

    公开(公告)号:CN112532539A

    公开(公告)日:2021-03-19

    申请号:CN201910879920.8

    申请日:2019-09-18

    Abstract: 本发明公开一种面向大规模并发通信的优化方法,包括以下步骤:S1、发送方向接收方发起发送请求,设置完成计数器初值;S2、接收方收到来自于发送方的发送请求后,匹配相关接收请求信息,向发送方应答目的地址信息;S3、发送方收到来自于接收方的请求应答后,投递拆分后的前n个传输请求;S4、如果探查到某一个传输请求完成,则将完成计数器的值减1,并判断当前完成计数器的值是否为0,如果为0,向发送方投递完成通知,否则,继续补充后续传输请求;S5、接收方收到来自于接收方的完成通知,置接收操作完成。本发明解决了网络资源竞争导致的性能干扰问题和并发通信的性能可扩展性问题,可有效增强并发通信优化手段的灵活性,提升大规模并发通信性能。

    一种基于物理位置感知的集合通信方法

    公开(公告)号:CN105391658B

    公开(公告)日:2018-07-06

    申请号:CN201510830368.5

    申请日:2015-11-24

    Abstract: 本发明提供了一种基于物理位置感知的集合通信方法,包括:感知目的进程的位置;在目的进程和位于同一物理芯片内时,通过查询确定本地运算核心是否空闲;在本地运算核心空闲的情况下,通过本地运算核心发起存储器直接访问操作,将通信数据直接写入所述同一物理芯片上的目的进程主存中,以使得所述同一物理芯片内的通信不需要再通过网络接口进行中转。本发明进行大规模集合通信时,通过感知目的进程的位置,结合路由芯片路由算法,根据无端口冲突原则,使得通信间的路由冲突最小化。

    基于异构众核处理器的多级访存方法、离散访存方法

    公开(公告)号:CN102929724B

    公开(公告)日:2016-04-13

    申请号:CN201210441328.8

    申请日:2012-11-06

    Abstract: 本发明公开了一种基于异构众核处理器的多级访存方法及离散访存方法。所述多级访存方法包括:从核读入第一次计算所需的数据;除第一次之外,从核在进行本次数据计算的同时,读入下一次计算所需的数据;除最后一次之外,从核在进行本次数据计算的同时,写回上一次计算结果数据;从核写回最后一次计算结果数据。所述离散访存方法包括:在从核上调整数组的存储顺序,将离散存储的数组调整为连续存储的数组;从核以多级访存方法,对所述数组进行通信读入数据、计算和通信写回数据。本发明实现了有效计算开销和多级存储资源访问开销之间最大限度的隐藏,提高了多级访存效率,充分发挥了从核的性能效率,从而提高科学计算课题的计算效率。

    面向众核处理器的压缩感知稀疏重构加速方法

    公开(公告)号:CN117394863A

    公开(公告)日:2024-01-12

    申请号:CN202311403458.7

    申请日:2023-10-26

    Abstract: 本申请涉及一种面向众核处理器的压缩感知稀疏重构加速方法。所述方法包括:获取待采样数据的待采样信号,并确定待采样信号的初始稀疏向量;当对待采样信号进行压缩感知时,从内存读取第一测量矩阵和第二测量矩阵,对第一测量矩阵和第二测量矩阵进行张量积运算,生成测量矩阵,其中,测量矩阵为克罗内克结构;根据生成的测量矩阵对初始稀疏向量进行迭代更新,直至满足终止阈值条件,得到目标稀疏向量,以实现待采样信号的压缩感知稀疏重构。采用本方法可以减轻信号处理过程中内存的负担,提高压缩感知的运行效率和数据处理速率,灵活处理数据,具有可扩展性。

Patent Agency Ranking