-
公开(公告)号:CN118351953A
公开(公告)日:2024-07-16
申请号:CN202410517259.7
申请日:2024-04-28
Applicant: 湖南大学
Abstract: 本发明涉及高性能计算技术领域,公开了一种基于流水线并行计算架构的分子动力学积分方法。本发明首先在GPU中构建仿真体系;然后修正仿真体系中的原子坐标;接着对仿真体系进行扩胞、切块、分包以及编码操作;此后GPU按照流水线模式调用势能面推理专用硬件(FPGA/ASIC)求解原子势能面;最后GPU基于专用硬件传回数据并行求解牛顿运动方程。按照上述流程不断迭代计算,直至达到所设定的仿真步数。本发明能够解决由于势能面推理专用硬件性能提升带来的协处理器性能瓶颈问题,具有硬件资源利用率高,仿真效率高等特点。
-
公开(公告)号:CN119065846A
公开(公告)日:2024-12-03
申请号:CN202411165297.7
申请日:2024-08-23
Applicant: 湖南大学
IPC: G06F9/50 , G06F12/0831
Abstract: 本发明涉及Linux内核驱动设计领域,提出了一种面向RDMA通信的Linux内核驱动设计方法,以供GPU与第三方设备在PCIe总线下实现无需CPU参与的直接通信。本发明首先将硬件FPGA和GPU挂载在同一PCIe Switch下,在FPGA上烧录相应的逻辑和存储单元工程;然后加载上RDMA驱动将物理地址空间与虚拟地址空间进行映射以供后续内核操作;之后,上位机GPU端进行内存分配和传入相关参数进驱动,驱动填充各种寄存器参数,进行DMA传输之前的准备工作;最后,启动DMA传输后,实现两个硬件的物理地址内存空间的数据交换,由此测试出传输过程中的通信速度并评估通信的质量。本发明使用GPUDirect RDMA技术来设计内核驱动,可以实现GPU和FPGA的直接内存通信,绕过CPU内存,避免多余的通信开销,提高了通信速度。
-
公开(公告)号:CN118349515A
公开(公告)日:2024-07-16
申请号:CN202410517855.5
申请日:2024-04-28
Applicant: 湖南大学
IPC: G06F15/173 , G06F13/42 , G16C10/00
Abstract: 本发明涉及人工智能和集成电路设计领域,公开了一种面向分子动力学计算的PCIe通信系统。本发明为分子动力学计算的FPGA或ASIC等“非冯·诺依曼”架构计算设备,设计基于PCIe的通信系统。该系统通过PCIe Switch进行连接,实现计算设备和GPU间的P2P通信,并通过特定滑窗算法设计,显著减少分子动力学通信数据量,实现高精度、高速度的分子动力学计算。
-
-