一种多节点MPI集合通信性能建模方法及系统

    公开(公告)号:CN119676099A

    公开(公告)日:2025-03-21

    申请号:CN202411941181.8

    申请日:2024-12-26

    Abstract: 本发明公开了一种多节点MPI集合通信性能建模方法及系统,首先根据节点内多核处理器信息和平台网络层次信息,确定所需测量的模型参数;然后在平台上测量节点内通信参数以及位于不同网络层次上的节点间通信参数;接下来分析集合通信源码并模拟通信算法行为,获得算法每一轮通信的所有通信特征;最后结合通信特征选择对应的参数,将每一轮的通信时间用对应参数的数学公式表示。本发明相比于现有模型,引入了超算网络层次结构信息和通信算法底层使用的点对点通信原语类型,将模型应用范围由单节点共享内存模型拓展至多节点共享内存和互连网络的混合模型,模型能够更精准地预测多节点集合通信操作的通信时间。

    一种分层分簇调度方法、系统、介质及设备

    公开(公告)号:CN116095177B

    公开(公告)日:2024-11-08

    申请号:CN202310082477.8

    申请日:2023-02-03

    Abstract: 本发明公开了一种分层分簇调度方法、系统、介质及设备,采集集群的各类资源数据、生成节点延迟矩阵;根据调度任务的一般容忍调用响应时间选择合适的延迟分层调度,查找当前选择的延迟分层是否存在,如果不存在则使用完全子图划分方法对集群节点组成的图进行分簇,分簇完成后将分簇信息以不同延迟标准分层保存,如果存在则读取当前延迟分层的分簇信息;然后依据簇群优先级公式计算各个簇群的优先级,选择优先级高的簇群进行调度。本发明通过将任务限制在簇群中调度,能够显著降低由节点间高延迟带来的任务响应时间过大的性能开销。

    一种分层分簇调度方法、系统、介质及设备

    公开(公告)号:CN116095177A

    公开(公告)日:2023-05-09

    申请号:CN202310082477.8

    申请日:2023-02-03

    Abstract: 本发明公开了一种分层分簇调度方法、系统、介质及设备,采集集群的各类资源数据、生成节点延迟矩阵;根据调度任务的一般容忍调用响应时间选择合适的延迟分层调度,查找当前选择的延迟分层是否存在,如果不存在则使用完全子图划分方法对集群节点组成的图进行分簇,分簇完成后将分簇信息以不同延迟标准分层保存,如果存在则读取当前延迟分层的分簇信息;然后依据簇群优先级公式计算各个簇群的优先级,选择优先级高的簇群进行调度。本发明通过将任务限制在簇群中调度,能够显著降低由节点间高延迟带来的任务响应时间过大的性能开销。

    一种GPU用抗量子攻击XMSS签名方法并行实现方法及系统

    公开(公告)号:CN116015635A

    公开(公告)日:2023-04-25

    申请号:CN202211601017.3

    申请日:2022-12-13

    Abstract: 本发明公开了一种GPU用抗量子攻击XMSS签名方法并行实现方法及系统,通过两层并行方法,包括第一层结构上的并行,第二层的Winternitz一次性签名相关结构和L树构建的并行,结合多级并行方案的决策,得到一个GPU上抗量子攻击XMSS签名方法的并行高效实现。通过两层并行方法,包括第一层结构上的并行,第二层的相关结构和L树构建的并行,结合多级并行方案的决策,实现了XMSS算法在GPU上的高效并行执行。

    一种面向粗粒度MPI+OpenMP混合并行的结构网格区域划分方法

    公开(公告)号:CN110543663B

    公开(公告)日:2021-07-13

    申请号:CN201910662152.0

    申请日:2019-07-22

    Abstract: 一种面向粗粒度MPI+OpenMP混合并行的结构网格区域划分方法,包括以下步骤:步骤1,构建目标网格所有的区域划分方式集合;步骤2,为每个区域划分方式Mx,My,Mz,threads四元组建立通信拓扑;步骤3,根据MPI通信面的大小对区域划分方式四元组进行过滤分类;步骤4,对S1的几何参数Mx,My,Mz执行面向cache‑aware的区域划分策略;步骤5,度量相同区域划分方式的不同进程、线程组合的性能差异;步骤6,计算出开销最小的区域划分方式四元组Mx,My,Mz,threads,将其作为输出的区域划分方式。本发明适用于粗粒度MPI+OpenMP混合并行方式。与其他的快速划分方式相比较,如通信量最小,往往能够找到更优的区域划分方式;与性能模拟器相比较,则具有高效的划分选择速度。

    智能TCP拥塞控制方法、系统、设备和存储介质

    公开(公告)号:CN112714074A

    公开(公告)日:2021-04-27

    申请号:CN202011607646.8

    申请日:2020-12-29

    Abstract: 智能TCP拥塞控制方法、系统、设备和存储介质,采集基于强化学习的TCP拥塞控制过程在t时刻的状态;根据采集的t时刻的状态的参数将基于强化学习的TCP拥塞控制过程抽象为一个可部分观察的马尔科夫决策过程,定义为五元组;采用近端策略优化计算在t时刻的奖励值期望,根据在t时刻的奖励值期望,调节控制动作,使奖励值期望最大化,适应网络的变化,实现网络拥塞控制的自学习。本发明采用近端策略优化方法进行模型更新,实现智能体快速学习。本发明相比传统Cubic、NewReno、HighSpeed具有更好的灵活性和适应性,可在不同的网络环境下资助学习最优拥塞控制策略,具有更优的网络传输性能。

    NVM的数据存储结构、存储方法、读取方法、设备及介质

    公开(公告)号:CN112612419A

    公开(公告)日:2021-04-06

    申请号:CN202011567944.9

    申请日:2020-12-25

    Abstract: 本发明属于计算机存储系统技术领域,公开了一种NVM的数据存储结构、存储方法、读取方法、设备及介质,包括主哈希表和公共溢出区;主哈希表内设置若干哈希桶,公共溢出区内设置第一级至第n级从哈希表,第一级至第n级从哈希表内均设置若干哈希桶。存储时,在线性哈希索引每次分裂的时候结合延迟分裂和正常分裂策略,降低线性哈希对NVM的写次数,提高写性能;公共溢出区设计多级从哈希表,将主哈希表内哈希桶的溢出桶存放在公共溢出区的从哈希表中,在提高线性哈希写性能的同时,提高线性哈希的读性能,实现读写友好的应用于NVM上的线性哈希索引方法。

    一种小样本硬盘故障数据生成方法、存储介质及计算设备

    公开(公告)号:CN112434733A

    公开(公告)日:2021-03-02

    申请号:CN202011290978.8

    申请日:2020-11-17

    Abstract: 本发明公开了一种小样本硬盘故障数据生成方法、存储介质及计算设备,基于长短期记忆网络作为生成对抗网络的生成网络,对硬盘SMART数据进行学习,对长短期记忆网络的梯度进行调整并生成用于对抗训练的虚拟硬盘故障数据;对生成的虚拟硬盘故障数据进行甄别,将真实的硬盘故障数据作为训练样本数据集;交替计算生成对抗网络中生成网络G和判别网络D的梯度并调整至收敛,完成小样本硬盘故障数据训练,训练完成后,加载模型中的生成网络G,将初始随机向量传给生成网络G,生成网络G生成虚拟硬盘故障数据。本发明能够有效地生成符合真实硬盘故障数据特点的虚拟硬盘故障数据,扩充硬盘故障数据样本集,提高机器学习算法识别硬盘故障的准确率。

    一种基于OpenMP/MPI混合并行CFD计算的细粒度共享内存通信同步方法

    公开(公告)号:CN108932172B

    公开(公告)日:2021-01-19

    申请号:CN201810681045.8

    申请日:2018-06-27

    Abstract: 本发明公开了一种基于OpenMP/MPI混合并行CFD计算的共享内存通信同步方法,包括以下步骤:每个MPI进程根据进程内线程的总个数初始化用于OpenMP共享缓冲通信的内存缓冲区,并初始化用于共享缓冲区同步的互斥锁,将互斥锁置于加锁状态;启动OpenMP线程进行迭代计算;每个线程根据标志字将需要通信的边界数据写入共享缓冲区,结束后将同步的互斥锁解锁;每个线程利用互斥锁同步从共享缓冲区读取自己需要的其他线程的边界数据;每个线程根据上步判断条件,继续依次判断自己的下一个面是否需要通信并加锁读取数据;判断标志字节是否为真,若为真则则返回到轮询的开始,继续进行加锁读取判断,否则终止循环,每个线程都通过共享缓冲获得了需要交换的边界数据。

    一种面向大规模集群系统的节点故障预测方法

    公开(公告)号:CN111027591A

    公开(公告)日:2020-04-17

    申请号:CN201911107846.4

    申请日:2019-11-13

    Abstract: 本发明公开了一种面向大规模集群系统的节点故障预测方法,收集各节点的资源占用量数据并生成数据集,使用长短期记忆网络构建第一数据预测模型,使用随机森林构建第二故障预测模型,建立第一观察窗口,判断第一观察窗口的大小,如果不满足设定值,返回重新构建;如果满足设定值,使用第一故障预测模型预测提前时间窗口内数据,将第一观察窗口与提前时间窗口内数据结合构成第二观察窗口,判断第二观察窗口的大小,如果不满足设定值,返回重新构建第二观察窗口;如果满足,使用第二故障预测模型预测预测窗口内的故障。本发明在确保有充足的提前时间对节点故障进行处理的前提下,使预测模型的准确率最高。

Patent Agency Ranking