一种数据与地址共用引脚自适应调整访存粒度的方法

    公开(公告)号:CN103246625A

    公开(公告)日:2013-08-14

    申请号:CN201310197024.6

    申请日:2013-05-24

    Applicant: 北京大学

    CPC classification number: G06F3/0658 G06F3/0604 G06F3/0671 G06F13/1678

    Abstract: 本发明提供了一种多核处理器中数据与地址共用引脚自适应调整访存粒度的方法。包括:采用数据与地址共用处理器芯片引脚的方式;处理器根据并行线程发出的访存指令调节程序运行期间数据信息传输与地址信息传输的比例,使得运行时程序发出粗粒度访存为主的情形下自动减少地址信息传输,在细粒度访存为主的情形下自动增加地址信息,达到自适应动态调节的作用。本发明所述的方法,能够根据程序行为自适应改变处理器芯片引脚功能的访存,可以简化编程,提高访存带宽利用率,解决了任务处理类程序访存发散,访存带宽利用率低的问题,具有良好的应用前景。

    针对GPU程序的源码级数据传输能耗估算方法

    公开(公告)号:CN102880785A

    公开(公告)日:2013-01-16

    申请号:CN201210271642.6

    申请日:2012-08-01

    Applicant: 北京大学

    Abstract: 本发明公布了一种针对GPU程序的源码级数据传输能耗估算方法,包括如下步骤:基础参数测量计算:针对具体的CPU+GPU异构体系平台单机系统,进行系列基本测量,标定程序状态相关的基本参数;其中,需要测量的基本状态包括:空闲状态、CUDA库运行状态、MPI消息等待状态、数据传输状态;针对具体程序估算数据传输能耗:根据所述参数的标定值对具体程序中数据传输能耗部分进行估算和预测。通过本发明所述的能耗估算方法,能够建立从源程序经由程序状态到能耗的映射关系,可以定性地预测传输能耗,为程序代码级的数据传输能耗估算和优化提供参考。

    一种针对分子动力仿真模型的并行化加速方法

    公开(公告)号:CN109871553A

    公开(公告)日:2019-06-11

    申请号:CN201711258343.8

    申请日:2017-12-04

    Applicant: 北京大学

    Abstract: 本发明公布了一种针对分子动力仿真模型的并行化加速方法,属于并行计算技术领域,针对具有时间依赖性的分子动力系统数据计算任务,采用运行在众核架构、以GPU为协处理器的集群进行分子动力学模型的并行化计算加速,使得在集群计算性能相同时,能够自适应地找到一个最大的时间步长进行一次数据交换,从而实现模型运行速度的加速优化,使得在并行化计算过程中,并行化计算速度从每一个时间步执行一次数据交换提升到平均更多次执行一次数据交换。采用本发明技术方案,能够提高计算准确性,加快计算速度,减少数据传输的通信开销,提高众核GPU集群系统对于分子动力学仿真模拟的整体计算性能。

    一种基于局部性表达函数优化MapReduce框架的运行效率的方法和装置

    公开(公告)号:CN108153585A

    公开(公告)日:2018-06-12

    申请号:CN201711249478.8

    申请日:2017-12-01

    Applicant: 北京大学

    CPC classification number: G06F9/4881

    Abstract: 本发明涉及一种基于局部性表达函数优化MapReduce框架的运行效率的方法和装置。该方法在Map阶段之前建立局部性表达函数,局部性表达函数通过实数值的大小关系表达局部性;在Map阶段根据计算出的局部性表达函数的值进行数据的加载,将不同数据按照局部性表达函数的数值区间分配给不同的计算节点来进行运算。在多轮MapReduce任务中,将局部性表达函数的值作为中间结果附带在Map和Reduce阶段,并在各个计算节点之间传递,以迭代计算局部性表达函数的值,在达到设定的收敛阈值之后,按照局部性表达函数的数值区间进行数据的重新分布。本发明的目的是通过局部性表达函数优化MapReduce框架的运行效率。

    一种支持局部性表达函数的大数据处理方法和系统

    公开(公告)号:CN108241472A

    公开(公告)日:2018-07-03

    申请号:CN201711250255.3

    申请日:2017-12-01

    Applicant: 北京大学

    Abstract: 本发明涉及一种支持局部性表达函数的大数据处理方法和系统。该方法包括以下步骤:1)发掘大数据处理系统中所处理的数据的局部性,形成局部性表达函数;2)将局部性表达函数部署在大数据处理系统中;3)大数据处理系统按照局部性表达函数分配工作任务。所述大数据处理系统采用分布式存储方式或集中式存储方式;所述局部性表达函数在大数据处理系统中的部署方式分为两种类型:内置式冷启动模式、外置式热插拔模式。本发明通过发掘数据中隐藏的局部性,并且使用自定义的局部性函数表达出来,最终被大数据处理系统识别,按照局部性来分配机器执行任务,从而达到优化处理效率。

    一种数据与地址共用引脚自适应调整访存粒度的方法

    公开(公告)号:CN103246625B

    公开(公告)日:2016-03-30

    申请号:CN201310197024.6

    申请日:2013-05-24

    Applicant: 北京大学

    CPC classification number: G06F3/0658 G06F3/0604 G06F3/0671 G06F13/1678

    Abstract: 本发明提供了一种多核处理器中数据与地址共用引脚自适应调整访存粒度的方法。包括:采用数据与地址共用处理器芯片引脚的方式;处理器根据并行线程发出的访存指令调节程序运行期间数据信息传输与地址信息传输的比例,使得运行时程序发出粗粒度访存为主的情形下自动减少地址信息传输,在细粒度访存为主的情形下自动增加地址信息,达到自适应动态调节的作用。本发明所述的方法,能够根据程序行为自适应改变处理器芯片引脚功能的访存,可以简化编程,提高访存带宽利用率,解决了任务处理类程序访存发散,访存带宽利用率低的问题,具有良好的应用前景。

    一种基于局部性表达函数优化MapReduce框架的运行效率的方法和装置

    公开(公告)号:CN108153585B

    公开(公告)日:2021-08-20

    申请号:CN201711249478.8

    申请日:2017-12-01

    Applicant: 北京大学

    Abstract: 本发明涉及一种基于局部性表达函数优化MapReduce框架的运行效率的方法和装置。该方法在Map阶段之前建立局部性表达函数,局部性表达函数通过实数值的大小关系表达局部性;在Map阶段根据计算出的局部性表达函数的值进行数据的加载,将不同数据按照局部性表达函数的数值区间分配给不同的计算节点来进行运算。在多轮MapReduce任务中,将局部性表达函数的值作为中间结果附带在Map和Reduce阶段,并在各个计算节点之间传递,以迭代计算局部性表达函数的值,在达到设定的收敛阈值之后,按照局部性表达函数的数值区间进行数据的重新分布。本发明的目的是通过局部性表达函数优化MapReduce框架的运行效率。

    基于蛋白质折叠测算蛋白质结构的集群并行计算加速方法

    公开(公告)号:CN110021339B

    公开(公告)日:2021-04-30

    申请号:CN201711439963.1

    申请日:2017-12-27

    Applicant: 北京大学

    Abstract: 本发明公布了一种集群并行计算加速方法,针对蛋白质折叠过程构建能量约束模型,在异构集群计算机上对计算的迭代过程进行并行加速;包括:将蛋白质折叠计算的近似计算划分为多个计算任务,每个节点根据本地计算任务和数据备份进行求解,期间不进行数据同步;当节点执行完多个时间步后进行数据同步;本节点计算任务的结果同本地数据备份比较,若发生改变,则以广播的方式在集群中传播数据,通知集群所有主机将本地备份进行更新,从而实现基于蛋白质折叠测算蛋白质结构的并行计算加速。本发明能够提高蛋白质折叠测算蛋白质结构求解的计算速度与精度,减少计算过程中的通信开销,节省计算资源。

    一种用于GPU异构集群的高性能FFT方法

    公开(公告)号:CN105224506B

    公开(公告)日:2018-02-13

    申请号:CN201510725866.3

    申请日:2015-10-29

    Applicant: 北京大学

    Abstract: 本发明公布了一种用于GPU异构集群的高性能FFT方法,将数据进行维度划分并表示为数组数据,按照划分维度进行分割后分布到GPU异构集群中与划分维度相同数目的节点上,再进行FFT计算,包括:获得GPU集群的节点数目、节点上GPU数目、节点内存容量、GPU设备存储器容量信息;将数据采用数组维度表示为数组数据;针对x维度进行维度划分;按照x维度分割数据,分布在多个节点上;将y和z维度方向的数据进行FFT计算;进行集群节点之间的数据转置;进行x维度的FFT计算。本发明是针对GPU异构集群的多层存储器体系结构特征的FFT方法,具有良好的性能和可延展性。

    一种针对分子动力仿真模型的并行化加速方法

    公开(公告)号:CN109871553B

    公开(公告)日:2021-07-09

    申请号:CN201711258343.8

    申请日:2017-12-04

    Applicant: 北京大学

    Abstract: 本发明公布了一种针对分子动力仿真模型的并行化加速方法,属于并行计算技术领域,针对具有时间依赖性的分子动力系统数据计算任务,采用运行在众核架构、以GPU为协处理器的集群进行分子动力学模型的并行化计算加速,使得在集群计算性能相同时,能够自适应地找到一个最大的时间步长进行一次数据交换,从而实现模型运行速度的加速优化,使得在并行化计算过程中,并行化计算速度从每一个时间步执行一次数据交换提升到平均更多次执行一次数据交换。采用本发明技术方案,能够提高计算准确性,加快计算速度,减少数据传输的通信开销,提高众核GPU集群系统对于分子动力学仿真模拟的整体计算性能。

Patent Agency Ranking