一种面向高性能计算的分布式数据组织方法

    公开(公告)号:CN106709048B

    公开(公告)日:2019-11-15

    申请号:CN201710006054.2

    申请日:2017-01-05

    Abstract: 一种面向高性能计算的分布式数据组织方法,在接口层将数据访问和数据管理分离开来;在计算节点端,客户端仅向应用程序提供精简的数据访问接口,支持对应用完全透明的POSIX形式的文件访问操作。本发明针对高性能计算应用的数据存储需求,对POSIX文件系统访问语义进行了精简,解耦数据访问和数据管理,为应用程序提供高效、轻量级的编程接口;采用分布式对象存储技术进行数据组织,突破传统文件系统数据组织限制,实现更为高效的数据访问协议,进一步提升系统可扩展能力;提出基于内存的元数据管理方式,首次将高性能非关系键值数据库引入高性能计算机系统,利用其优良特性对外提供高效可扩展的元数据服务。

    缓存一致性测试方法
    12.
    发明授权

    公开(公告)号:CN105446841B

    公开(公告)日:2019-02-12

    申请号:CN201510830049.4

    申请日:2015-11-24

    Abstract: 本发明提供了一种缓存一致性测试方法,包括:主进程申请一个共享空间;由主进程创建出多个子进程;在该共享空间中划分出四个共享空间部分;由主进程对读操作和写操作访问的内存块号进行排列,使读操作和写操作访问的内存地址不重叠,而且使所述多个子进程进入同步接口;在所述多个子进程同步成功后,读取所述排列好的序列,让所述主进程和所述多个子进程同时进行读写操作;在所述主进程和所述多个子进程的读写操作都完成后,每个进程对自己访问的读空间和写空间分别用异或操作来计算权值,并且比较读操作和写操作访问的内存的权值。

    一种异构代码融合的编译和生成方法

    公开(公告)号:CN105426226A

    公开(公告)日:2016-03-23

    申请号:CN201510828419.0

    申请日:2015-11-24

    CPC classification number: G06F8/443

    Abstract: 本发明提供了一种异构代码融合的编译和生成方法,包括:利用运算控制核心编译器和运算核心编译器分别为运算控制核心和运算核心生成第一对象文件和第二对象文件;运算核心编译器自动实现对第一对象文件中的函数的重命名,在函数名的前加上前缀;链接器将重命名后第一对象文件与第二对象文件链接融合为统一的可执行程序。

    一种编译器及软件管理存储器的重用优化方法

    公开(公告)号:CN102880497A

    公开(公告)日:2013-01-16

    申请号:CN201210372306.0

    申请日:2012-09-28

    Abstract: 本发明实施例公开了一种编译器及软件管理存储器的重用优化方法,用于对软件管理存储器进行重用优化,实现软件管理存储器的空间重用分配。本发明实施例中的编译器包括:分析模块,用于根据待写入软件管理存储器的变量的排布方式增加关键字,将关键字及变量的信息发送给编译模块;编译模块,用于识别关键字,为关键字设置重用标识;对设置了重用标识的关键字对应的变量生成具有重用特征的代码形式,将具有重用特征的代码形式发送给链接模块;链接模块,用于根据具有重用特征的代码形式生成临时链接脚本,对临时链接脚本进行链接处理,并进行重用变量的排布,实现软件管理存储器的空间重用分配。

    一种程序调试方法及系统
    16.
    发明公开

    公开(公告)号:CN102541727A

    公开(公告)日:2012-07-04

    申请号:CN201010594006.8

    申请日:2010-12-17

    Abstract: 本发明公开了一种程序调试方法及系统,能够将针对尚未研制成功的CPU芯片的程序转换为针对已研制成功并可靠性高的CPU芯片体系结构上的程序,并使用标准的调试器进行调试,对程序的正确性和性能进行分析和评估,从而避免了使用体系结构模拟器进行模拟所带来的处理速度慢、可靠性低的缺点。由于使用了已有的硬件资源和标准的调试器,所以处理速度较快,并且可靠性较高。

    基于RMA的众核分布式共享SPM实现方法

    公开(公告)号:CN112631593B

    公开(公告)日:2022-10-04

    申请号:CN201910904073.6

    申请日:2019-09-24

    Abstract: 本发明公开了一种基于RMA的众核分布式共享SPM实现方法,语言级共享SPM空间描述方法,由编程人员显示申明共享SPM数据;编译器对程序中的共享SPM数据的访问转换为RMA消息,根据访问特征生成对应的高效RMA操作;运行时提供高效RMA支持。本发明为用户提供分布式共享SPM变量的描述机制,并通过运行时RMA实现众核核心SPM的逻辑共享,简化众核核心间的通信,增大众核核心能够访问的高速缓存的空间;同时,充分利用众核处理器SPM和RMA的优势,简化在众核处理器上的编程,提高众核处理器的好用性、易用性,提升众核系统的可编程性。

    一种异构众核架构上基于算子融合的数据复用方法

    公开(公告)号:CN114239669A

    公开(公告)日:2022-03-25

    申请号:CN202110398219.1

    申请日:2021-04-14

    Abstract: 本发明公开一种异构众核架构上基于算子融合的数据复用方法,将DNN算子库中依次调用的至少两个算子A、B进行功能融合,获得融合算子C,执行以下操作:S1、融合算子C从主存中读取数据到局存中,并将读取的数据作为算子A的输入;S2、算子A将获取的数据作为输入,进行相应的运算,完成算子A的功能计算,此时算子A将结果保留在局存中不写回主存;S3、算子A将局存中的计算结果传递给算子B,作为算子B的输入;S4、算子B将来自算子A的数据作为输入;S5、算子B完成运算后,将最终的计算结果从局存写回主存;S6、算子C运算结束。本发明极大减少了内存访问次数,提高了数据的复用率,综合提升了可融合算子的效率。

    基于数据压缩存储的细粒度并行查表方法

    公开(公告)号:CN112636765A

    公开(公告)日:2021-04-09

    申请号:CN201910903873.6

    申请日:2019-09-24

    Abstract: 本发明公开了一种基于数据压缩存储的细粒度并行查表方法,包括以下步骤,原始数据压缩,将原细元素粒度的表按照其粒度压缩存储为int类型的表X;根据原表元素粒度生成不同的掩码表Y;根据原表元素粒度对原查表偏移进行处理,得到偏移量为A和B;按查表偏移A按int类型并行查表X,得到查表结果X1;按查表偏移B按int类型并行查表Y,得到查表结果Y1;对X1和Y1进行逻辑运算及移位操作得到最终查表结果。本发明是对用户原始细粒度表元素合并压缩存储,通过增加简单逻辑运算及移位运算实现细粒度的并行查表功能,有效避免以int为单位进行查表导致的空间膨胀,大大提升了具有细粒度查表类课题的向量并行优化的可能性。

    用户透明的运算核并行打印保序代理方法

    公开(公告)号:CN112486424A

    公开(公告)日:2021-03-12

    申请号:CN201910861483.7

    申请日:2019-09-12

    Abstract: 本发明公开了一种用户透明的运算核并行打印保序代理方法,对运算核上的打印输出语句进行扩展替换,将打印输出语句变换成调用运行时系统中的线程打印处理函数;对线程打印处理函数进行参数解析,申请数据转存缓冲区,根据参数类型进行数据转存;运算核请求控制核进行打印保序代理,将申请的数据转存缓冲区首地址传送给控制核;控制核接到中断信号,转入中断处理,根据数据转存缓冲的参数类型执行嵌汇编指令装填打印函数参数,调用printf代理实现运算核打印输出。本发明采用编译器和运行时相结合,自动完成所有运算核的并行有序输出;对用户透明且不需要对运算核的打印输出进行额外管理;只需要运算核的基础编译器对运算核程序进行简单的程序变换即可。

Patent Agency Ranking