基于MPI的软件消息重传容错方法

    公开(公告)号:CN112445627A

    公开(公告)日:2021-03-05

    申请号:CN201910826408.7

    申请日:2019-09-03

    Abstract: 本发明公开一种基于MPI的软件消息重传容错方法,基于MPI消息库,包括以下步骤:S1、消息发送方发起消息发送操作,并发起对消息接收方网络接口的请求(Req);S2、接收方接收来自发送方的请求和/或消息数据后,发送一个消息应答(Ack)给消息发送方;S3、消息发送方收到来自消息接收方的消息应答(Ack),确认消息发送成功,否则,进入S4;S4、位于消息发送方的消息容错处理模块向消息接收方发起针对消息的查询请求;S5、位于消息接收方的消息容错处理模块查询本地与该消息相关的硬件资源,并将查询结果返回给发送方;S6、消息发送方根据查询结果,确定是否重传消息。本发明通过查询/应答协议确认消息丢包错误,使用消息重传实现容错,为网络通信容错提供支持,且对用户透明。

    大规模异构环境下资源环境动态部署方法

    公开(公告)号:CN112445493A

    公开(公告)日:2021-03-05

    申请号:CN201910800979.3

    申请日:2019-08-28

    Abstract: 本发明公开一种大规模异构环境下资源环境动态部署方法,包括以下步骤:S1、镜像管理系统生成若干基础镜像模板;S2、资源管理系统在物理节点上运行精简操作系统;S3、资源管理系统将资源环境需求发送给精简操作系统;S4、精简操作系统将该资源环境需求规格化为相应的配置文件和配置脚本;S5、精简操作系统在物理节点上按配置文件快速部署所需资源环境的镜像;S6、精简操作系统中获取对应的配置脚本;S7、运行配置脚本,完成对资源管理系统需求的资源环境的部署;S8、当资源管理系统的资源环境需求发生改变时,转到S3执行。本发明解决了传统大规模异构环境下节点资源启动时间长、用户运行环境需求多样从而导致的用户资源环境繁琐复杂、重构时间过长的问题。

    基于编译指导的有读写依赖循环的多线程并行方法

    公开(公告)号:CN112445486A

    公开(公告)日:2021-03-05

    申请号:CN201910800767.5

    申请日:2019-08-28

    Abstract: 本发明公开一种基于编译指导的有读写依赖循环的多线程并行方法,包括以下步骤:S1、在循环迭代开始处添加编译指导语句;S2、编译器根据编译指导语句生成数据读写状态表;S3、编译器在对程序中依赖数组进行读访问时,增加判断语句;S4、编译器在对程序中依赖数组进行写访问后,增加对数据读写状态表中该数据对应元素的更新操作;S5、当程序多线程运行时,数据读写状态表中所有数据状态均初始化成false;S6、线程x执行对依赖数组中一个数据的写访问后,将数据读写状态表中对应的状态设置为true。本发明实现了迭代间有先写后读依赖的循环的并行计算,解决了多线程并行时数据的无序竞争访问,能有效提高程序的性能。

    面向处理器指令cache的低功耗编译方法

    公开(公告)号:CN112445480A

    公开(公告)日:2021-03-05

    申请号:CN201910794737.8

    申请日:2019-08-27

    Abstract: 本发明公开一种面向处理器指令cache的低功耗编译方法,包括以下步骤:S1、寻找最内层循环;S2、判断寻找到的最内层循环是否可以展开;S3、结合L0 cache计算展开次数:即根据循环体的最大伪指令条数MAX_UNROLLED_INSNS、循环体的最大平均伪指令条MAX_AVERAGE_UNROLLED_INSNS和最大展开次数MAX_UNROLL_TIMES,计算展开次数;S4、根据展开次数实现代码展开;S5、在编译器中端,对循环中语句建立依赖关系图,并把循环中每一条语句设为一个区域;S6、遍历所有区域,检查是否有生产者消费者的依赖关系;S7、根据L0 cache容量大小确定最优分区大小;S8、有选择的进行合并语句;S9、将剩余的每一个分区都生成一个循环树,实现循环剥离。本发明实现了循环优化的精细控制策略,保证L0 cache的高命中率,有效降低取指和译码功耗,以提高性能减少功耗。

    面向SPM存储层次的数据缓存实现方法

    公开(公告)号:CN112433965A

    公开(公告)日:2021-03-02

    申请号:CN201910788897.1

    申请日:2019-08-26

    Abstract: 本发明公开一种面向SPM存储层次的数据缓存实现方法,包括以下步骤:S1、建立数据缓存的编程描述;S2、编译器分析编译指示,确定循环分块参数LoopBlockKey;S3、编译器根据S2中获得的循环分块参数,计算每一个循环块的计算、访存开销与数据传送开销的比值,得到并行隐藏参数Hkey;S4、根据S3得到的并行隐藏参数,反馈修正,得到最终的循环分块参数;S5、根据循环分块参数和并行隐藏参数,选择循环重构策略进行循环重构。本发明有效提升了编译器的上下文分析精确度和应用的访存效率,且可以做到计算与不同存储层次间的数据传送并行进行,有效利用处理器的各个存储层次,更进一步提升程序性能。

    基于数据相关性约束的随机指令序列生成方法

    公开(公告)号:CN112433762A

    公开(公告)日:2021-03-02

    申请号:CN201910789113.7

    申请日:2019-08-26

    Abstract: 本发明公开一种基于数据相关性约束的随机指令序列生成方法,包括以下步骤:S1、对指令集合进行信息提取;S2、生成的指令数目达到要求则终止,否则继续随机选择一条指令;S3、如果该指令没有操作数,跳转至S2,否则继续;S4、计算指令上下文中与当前指令生成可能存在关系的最大指令数目;S5、解析当前指令;S6、构建上下文指令间的约束关系;S7、对形成的CNF范式进行合取,并利用求解器进行求解;S8、如果没有求解结果,则跳转至S2;S9、如果求解结果满足,则对求解结果进行解析;S10、将当前生成的指令保存在缓存队列中;S11、跳转至S2继续。本发明构建了满足约束条件的随机指令生成模型,自动生成随机指令序列,达到高功耗测试以及极限情况下指令执行部件正确性测试的目的。

    一种访存系统
    127.
    发明授权

    公开(公告)号:CN110727401B

    公开(公告)日:2021-03-02

    申请号:CN201910846714.7

    申请日:2019-09-09

    Abstract: 一种访存系统,计算机体系结构与处理器微结构设计技术领域。系统包括存储控制器和存储器;存储器为由两组存储颗粒构成的128位存储器,每组存储颗粒为64位;存储控制器包括用户接口、第一控制通路CCH0、第二控制通路CCH1、第一数据通路DCH0和第二数据通路DCH1;用户接口用于接收上层访存请求并将其分发至第一控制通路CCH0、第二控制通路CCH1、第一数据通路DCH0和第二数据通路DCH1,之后负责收集响应并返回;在单通道模式下,第一控制通路CCH0或第二控制通路CCH1用于同时管理第一数据通路DCH0和第二数据通路DCH1;在双通道模式下,第一控制通路CCH0和第二控制通路CCH1分别管理第一数据通路DCH0和第二数据通路DCH1。本发明能灵活配置成支持高可靠的应用场景和高带宽的应用场景。

    面向异构众核基于空间重排的数据传输方法

    公开(公告)号:CN112416825A

    公开(公告)日:2021-02-26

    申请号:CN201910771644.3

    申请日:2019-08-21

    Abstract: 本发明公开一种面向异构众核基于空间重排的数据传输方法,包括以下步骤:S1、在编译时,为每个加速区建立一张数据传输信息表,此数据传输信息表中包含当前加速区待传输数据的信息;S2、按照数据的传输模式,将待传输的多个数据进行空间重排;S3、在加速区计算开始之前,启动主存数据到局存缓冲区的DMA数据传输,将加速区计算所需的数据,包括读入的数据和读写的数据,从主存一次传输至局存的缓冲区中;S4、在加速区计算完成之后,启动局存缓冲区到主存的DMA数据传输,将加速区需要传输的要写出的数据,包括读写的数据和写出的数据,从局存缓冲区一次传输至主存中。本发明有效降低众核片上局存和主存之间多次数据传输的开销,提升了程序的访存效率和整体性能。

    段页结合的内存管理方法
    129.
    发明公开

    公开(公告)号:CN112395078A

    公开(公告)日:2021-02-23

    申请号:CN201910763767.2

    申请日:2019-08-19

    Abstract: 本发明公开一种段页结合的内存管理方法,包括以下步骤:S1、获取整个服务器上可供使用的物理内存;S2、从可供使用的物理内存中预留一段或多段连续物理内存,并将预留的连续物理内存加入段式物理内存资源池;S3、将可供使用的物理内存中未被加入段式物理内存资源池的剩余物理内存加入页式物理内存资源池;S4、当计算部件需要物理内存时,通过段式内存申请接口向段式物理内存资源池申请物理内存;S5、当普通用户程序需要物理内存时,操作系统内核将申请的物理内存空间大小与处理器支持的大页页面大小进行比较。本发明通过灵活的内存管理策略,解决了特殊计算部件对大块连续物理内存的需求,同时兼顾普通用户程序内存使用的需求,灵活适应不同的内存需求场景。

    基于窗口的错误访存请求重传系统及方法

    公开(公告)号:CN110727530B

    公开(公告)日:2021-02-19

    申请号:CN201910861819.X

    申请日:2019-09-12

    Abstract: 本发明涉及计算机体系结构与处理器微结构技术领域,具体为一种基于窗口的错误访存请求重传系统及方法。基于窗口的错误访存请求重传系统,包括重传缓冲,用于缓存正在飞行的请求,如果请求完成则将其释放,如果请求出错则根据出错请求的错误类型进行重传;错误监测模块,用于获取出错请求的错误类型。基于窗口的错误访存请求重传方法,包括1)将符合要求的请求进行发射并加入到读FIFO或写FIFO中;2)如果请求出错,则根据出错请求的错误类型通过重传发射FIFO进行重传;如果请求发射正常,则将其释放。本申请能够有效挽救大部分由于DDR4存储器访存链路上信号偶发错误导致的读ECC错、写CRC错和命令地址校验错所带来的故障,使其能够满足访存请求的保序原则。

Patent Agency Ranking