一种基于双空间查找树的快速分布式面面匹配方法

    公开(公告)号:CN119961479A

    公开(公告)日:2025-05-09

    申请号:CN202510428178.4

    申请日:2025-04-08

    Abstract: 本发明提供的一种基于双空间查找树的快速分布式面面匹配方法,涉及数值仿真领域,包括:将面片集合A分布式存储,面片集合B集中式存储;对面片集合A和面片集合B分别建立空间查找树TreeA和TreeB;存储面片集合A的各进程遍历本进程TreeA的每层包络盒,对本进程TreeA的每层包络盒分别遍历TreeB的每层包络盒,计算两者的包络盒是否相交;若相交,计算两者相交包络盒中的面片是否精确相交;若精确相交,将匹配后的两个面片组成匹配对,记录匹配对的元数据信息;所有进程收集每个进程的匹配对的元数据信息。本发明能够解决现有技术采用对两组面片集合逐个遍历的方法进行面面匹配时,计算量大,计算效率低的问题。

    基于FPGA并行加速的稀疏矩阵求解方法

    公开(公告)号:CN112231630B

    公开(公告)日:2024-02-02

    申请号:CN202011156271.8

    申请日:2020-10-26

    Abstract: 本发明提供的基于FPGA并行加速的稀疏矩阵求解方法,通过对稀疏矩阵进行分解、对下三角矩阵对角线元素取倒数、根据数据依赖关系对数据进行分割分配、并对每个处理单元内的数据进行排布、依据排布的运算顺序采用精确的节拍级硬件资源调度进行计算,从而实现高度融合的软硬件协同加速、稀疏矩阵求解的细粒度并行流水,有效解决了现有技术中存在的处理效率低、浪费计算资源、甚至无法进行计算的问题,节省计算资源、提高处理效率。(56)对比文件Fialko Sergiy.Parallel direct solverfor solving systems of linear equationsresulting from finite element method onmulti-core desktops and workstations.《Computers & Mathematics withApplications》.2015,第70卷(第12期),2968-2987.Chai Wenwen 等.An LU decompositionbased direct integral equation solver oflinear complexity and higher-orderaccuracy for large-scale interconnectextraction《.IEEE Transactions on AdvancedPackaging》.2010,第33卷(第4期),794-803.陈尧 等.GPU加速不完全Cholesky分解预条件共轭梯度法《.计算机研究与发展》.2015,(第04期),843-850.

    一种小分子化学体系的哈密顿量模拟方法和装置

    公开(公告)号:CN115169565A

    公开(公告)日:2022-10-11

    申请号:CN202211098612.X

    申请日:2022-09-09

    Abstract: 本发明公开一种小分子化学体系的哈密顿量模拟方法和装置,该方法包括:步骤一,首先在经典计算机上根据电子体系轨道数生成Hatree‑Fock初态,二次量子化哈密顿量,通过JW变换将费米子算符变成泡利算符,生成基于UCCSD ansatz的量子门电路;步骤二,通过量子计算机运行量子门电路;步骤三,在经典计算机上,运用分组启发式优化算法,优化并更新量子门电路的参数;步骤四,将更新参数后的量子门电路再次通过量子计算机运行,以此循环迭代直至收敛,计算出哈密顿量的特征。本发明通过经典‑量子结合的方法,克服经典计算遇到的“指数墙”困难,结合经典启发式优化算法,有效缓解误差,避免了量子计算机的噪声等问题。

    节点行列全互连网络的高效传输方法

    公开(公告)号:CN108965012B

    公开(公告)日:2021-08-03

    申请号:CN201810825747.9

    申请日:2018-07-25

    Abstract: 本发明通过先统筹排列再按顺序分时传输的方法对需要传输的任务进行传输,通过任务路径确定方法、路径确定策略及转置已确定任务策略将逻辑行列互连网络传输效率问题转化为时空互斥条件下的时间层最小化问题或者是各时间层内并发度最大化问题,相较传统传输模式,充分利用空闲节点,最大化填充网络,大幅度提升传输并发度,大幅提高传输效率,有效地缓解了传输不平衡问题及有效避免了拥堵和死锁的发生。

    基于申威处理器的深度学习算子自动优化系统及方法

    公开(公告)号:CN110929850A

    公开(公告)日:2020-03-27

    申请号:CN201911177238.0

    申请日:2019-11-26

    Abstract: 本发明提供的基于申威处理器的深度学习算子自动优化系统,包括获取单元,获取专用的描述语言定义计算任务和优化空间的描述;调度单元,根据优化空间的描述构建优化空间,依据优化空间中不同优化方法对计算任务描述调度生成若干不同的计算实现,输出用中间表示表达的计算实现;优化单元,接收中间表示,对中间表示执行优化,输出优化后的中间表示;优化空间搜索单元,从优化后的中间表示中搜索出最优的计算实现;代码生成单元,将最优的计算实现翻译为在申威处理器上可以执行的代码。本发明能够解决现有技术中优化性能低、难以移植、优化时间开销大的问题,高效于手动优化技术和自动优化技术,并且可以能够方便地移植到其他机构上使用。

    基于寄存器间通信的非对齐内存访问加速方法

    公开(公告)号:CN109766208A

    公开(公告)日:2019-05-17

    申请号:CN201910022433.X

    申请日:2019-01-10

    Abstract: 本发明提供的基于寄存器间通信的非对齐内存访问加速方法,属于计算机技术领域,包括:存储在DMA中数据点集沿y方向分隔为m行数据点集行;从核集群的一个x方向的m个从核从DMA中分别读取一行数据点集行;每个从核利用寄存器通信将其读取的数据点集行中的属于相应从核部分的数据通信给相应从核;其中,从核集群的x方向的从核个数为m;m个从核需要读取的数据依次沿x方向排列构成数据点集存储在DMA中。本发明通过分行读取与寄存器间通信相结合的方式,降低了数据的总体访问量,减少非对齐内存访问次数,提升DMA带宽的利用率。

    跨平台集合数值气象预报模拟方法

    公开(公告)号:CN118195344A

    公开(公告)日:2024-06-14

    申请号:CN202410293921.5

    申请日:2024-03-14

    Abstract: 本发明提供的一种跨平台集合数值气象预报模拟方法,涉及高性能并行计算领域和气象数值模拟领域,包括:选取气象预报模式,并将其部署在不同架构的平台上;配置不同的物理参数化方案到不同架构的平台上的气象预报模式中;采用高精度的初值数据,运行气象预报模式获得模拟结果,使用客观权重集合预报方法对模拟结果进行集合平均,获得最终气象预报结果。本发明能够解决预报结果正确性不稳定、部署在同一个平台上时算力不足的问题,满足气象预报在高分辨率应用场景下的算力要求,将更多的大气真实状态包含在模拟预报过程中,有效降低数值计算过程中因跨平台的舍入误差引起的结果偏差,提高预报结果的准确性,稳定预报结果的正确性。

Patent Agency Ranking