大数据、人工智能、超算协同的材料性能预测方法

    公开(公告)号:CN108876038B

    公开(公告)日:2021-07-16

    申请号:CN201810629623.3

    申请日:2018-06-19

    Abstract: 本发明提供一种大数据、人工智能、超算协同的材料性能预测方法,涉及材料性能预测技术领域,所述方法包括:获取原始数据集并进行预处理;创建多个不同的贝叶斯深度网络模型;构造权重的高斯先验分布;构造似然函数;根据贝叶斯准则计算权重的后验概率分布函数;然后利用高斯近似方法在超级计算机上并行求解每个模型的参数后验,直至参数后验收敛;之后利用预测集通过每个网络模型得到预测输出,计算每个贝叶斯深度网络模型的占所有网络的权重比;最后根据训练好的贝叶斯深度网络模型对预测集进行预测,得到最终预测值和预测值的误差条,至此,整个网络模型构建完毕。本发明的方法能够提高材料性能预测的质量和效率。

    一种应用于分子动力学模拟软件的访存优化方法及装置

    公开(公告)号:CN112069091A

    公开(公告)日:2020-12-11

    申请号:CN202010828235.5

    申请日:2020-08-17

    Abstract: 本发明公开了一种应用于分子动力学模拟软件的访存优化方法及装置,该方法包括:基于运行平台的从核阵列的架构,将每个从核的本地存储空间分别划分为第一缓存区、第二缓存区和第三缓存区;基于访存数据的总量大小和访存是否规则对数据访存模式进行分类,根据访存模式将访存数据分别存入对应的缓存区;在第一缓存区中,采用哈希映射的方式进行数据映射查找,采用链地址法解决数据冲突,并利用从核之间的寄存器通信进行数据共享;在第二缓存区中,采用双缓冲技术批量访问规则数据,隐藏从核和主存的通信开销。本发明减小了查找开销,提高了空间利用率和命中率,可有效提升程序运行效率。

    一种动力学蒙特卡洛并行模拟的通信优化方法及其系统

    公开(公告)号:CN107239352B

    公开(公告)日:2019-11-29

    申请号:CN201710397637.2

    申请日:2017-05-31

    Abstract: 本发明提供一种动力学蒙特卡洛并行模拟的通信优化方法及系统,其中,所述方法包括:构造通信数据结构;构建邻居进程的图状拓扑结构;开启进程外迭代;按照预设顺序从多个子区域中选择一个子区域;进程当前选择的子区域数据通过构造的所述通信数据结构与邻居进程通信;迭代结束。本发明还提供一种动力学蒙特卡洛并行模拟的通信优化系统。本发明提供的技术方案通过构建进程图状拓扑结构,使用邻居集合通信函数代替原有的点到点通信函数,进而降低了通信时间复杂度,通过优化程序流程,选取最优的子区域迭代顺序,合并相邻两次内迭代的部分通信操作,从而减少了部分通信冗余数据,减少了进程间的同步等待时间,使负载更加均衡。

    大数据、人工智能、超算协同的材料性能预测方法

    公开(公告)号:CN108876038A

    公开(公告)日:2018-11-23

    申请号:CN201810629623.3

    申请日:2018-06-19

    Abstract: 本发明提供一种大数据、人工智能、超算协同的材料性能预测方法,涉及材料性能预测技术领域,所述方法包括:获取原始数据集并进行预处理;创建多个不同的贝叶斯深度网络模型;构造权重的高斯先验分布;构造似然函数;根据贝叶斯准则计算权重的后验概率分布函数;然后利用高斯近似方法在超级计算机上并行求解每个模型的参数后验,直至参数后验收敛;之后利用预测集通过每个网络模型得到预测输出,计算每个贝叶斯深度网络模型的占所有网络的权重比;最后根据训练好的贝叶斯深度网络模型对预测集进行预测,得到最终预测值和预测值的误差条,至此,整个网络模型构建完毕。本发明的方法能够提高材料性能预测的质量和效率。

    SOR的并行通信优化方法
    25.
    发明公开

    公开(公告)号:CN101430654A

    公开(公告)日:2009-05-13

    申请号:CN200810239582.3

    申请日:2008-12-12

    Abstract: SOR的并行通信优化方法,本发明针对传统的SOR迭代方法并行化中的通信和同步开销问题,提出了多层对称SOR迭代方法,并通过交错条块方法实现串行执行在高性能网络计算环境下的并行化。交错条块方法包括:引入了时滞技术改进区域分解方法,实现空间网格的划分;并通过网格条块重排序,改变网格条块间的数据依赖关系,提高条块执行的并行度,较大幅度地减少了通信启动和同步次数。因此,本发明比传统的区域分解方法和红黑排序方法具有更好的并行效率和可扩展性。

    一种支持合并访存和循环队列的GPU模板计算方法

    公开(公告)号:CN116126540A

    公开(公告)日:2023-05-16

    申请号:CN202310181904.8

    申请日:2023-02-21

    Abstract: 本发明公开一种支持合并访存和循环队列的GPU模板计算方法,所述方法包括:合并访存读取二维平面上的一块数据;基于循环队列的模板计算。针对以往在GPU上使用的2.5D分块模板计算方法能够很好地复用某一条轴上的数据(通常为轴),但无法实现完全的合并访存,也难以适用于计算物理中复杂的复合微分算子。现代GPU的访存效率远小于计算效率,无法利用合并访存的计算应用很难充分利用GPU的性能。本发明建立一种结合了循环队列和合并访存的分块模板计算方法,能够充分利用GPU的访存性能,并且适用于复杂的微分算子。

    并行程序编译方法及系统
    29.
    发明公开

    公开(公告)号:CN101387965A

    公开(公告)日:2009-03-18

    申请号:CN200810224147.3

    申请日:2008-10-24

    Abstract: 本发明涉及一种并行程序编译方法,包括:数据划分步骤;数据重分布步骤;循环迭代划分步骤;循环迭代重分布步骤;通信I/O观测步骤;计算和通信的代码段生成步骤。本发明还涉及一种并行程序编译系统,包括:数据划分模块;数据重分布模块;循环迭代划分模块;循环迭代重分布模块;通信I/O观测模块;计算通信I/O操作代码段生成模块。本发明建立了核外非规则计算编译系统,简化了核外和非规则的并行计算问题,并提高该类程序的可移植性,该运行库基于消息传递MPI机制,具有用于支持并行程序的资源。

Patent Agency Ranking