一种用于分子动力学的芯片架构模拟系统

    公开(公告)号:CN120032731A

    公开(公告)日:2025-05-23

    申请号:CN202510216967.1

    申请日:2025-02-26

    Abstract: 本发明提供一种用于分子动力学的芯片架构模拟系统,用于模拟面向DeePMD模型的加速器的受力计算过程,该系统包括可编程IO模块、地址映射模块、数据传输模块和异构加速器,可编程IO模块用于通过主机访问和控制异构加速器;地址映射模块用于建立内存与异构加速器间的映射关系;数据传输模块用于根据映射关系执行内存与异构加速器间的数据传输,包括传输原子信息;异构加速器包括:计算逻辑子模块,用于根据原子信息模拟DeePMD模型对原子的受力计算过程,得到原子的受力,并统计受力计算时间;资源建模子模块,用于评估计算逻辑子模块在受力计算过程中的资源占用率;并行度调度子模块,用于以最小化受力计算时间为优化目标,优化计算逻辑子模块的并行度。

    一种数据的传输方法及系统

    公开(公告)号:CN114928573B

    公开(公告)日:2024-09-24

    申请号:CN202210558480.8

    申请日:2022-05-20

    Abstract: 本发明实施例提供了一种数据的传输方法,包括:在与接收方建立的连接上发送一个数据包,其中,每个连接设有对应的连接号;根据所发送的数据包产生一个对应的发送事件,所述发送事件指示针对所述数据建立的连接的连接号以及所述数据包的发送序列号;响应于发送事件,调整为对应连接中发送数据包的计数的数值,并确定当前计数的数值是否达到指定的冗余发送阈值,若是,则根据发送事件中的发送序列号复制对应的数据包,以作为冗余数据包发出,其中,冗余发送阈值与所述连接对应的丢包情况相关。本发明实施例的技术方案通过在计数的数值达到指定的冗余发送阈值时,主动复制对应的数据包,以作为冗余数据包再次发出,在一定程度上降低了接收方的丢包概率,从而提升网络整体性能。

    一种多根CPU下的PCIe交换芯片上、下游端口路由表构建方法

    公开(公告)号:CN114265804B

    公开(公告)日:2024-06-11

    申请号:CN202111587159.4

    申请日:2021-12-23

    Abstract: 本发明提供了一种多根CPU下的PCIe交换芯片上、下游游端口路由表构建方法,用于构建上、下游端口路由表,所述PCIe芯片被划分为多个虚拟交换机,每一个虚拟交换机配置有唯一的虚拟机交换标识,每个虚拟交换机均包括一个上游端口和多个下游端口,其中,上游端口路由表构建方法包括:在每个虚拟交换机的上游端口重复执行如下步骤直至完成上游端口到当前虚拟交换机下的所有下游端口的路由表项构建:S1、上游端口捕获与其相连的操作系统下发的包含当前上游端口所属虚拟交换机标识的且与下游端口路由相关的配置包;S2、解析所述配置包中与路由相关的信息并根据解析到的路由相关信息构建当前虚拟交换机下的上游端口路由表项。

    一种用于深度学习的芯粒互联系统

    公开(公告)号:CN117151183A

    公开(公告)日:2023-12-01

    申请号:CN202311122958.3

    申请日:2023-09-01

    Abstract: 本发明提供了一种用于深度学习的芯粒互联系统,所述芯粒中每个芯粒设有电光通信端口,所述芯粒分为CPU芯粒和GPU芯粒,所述系统包括:至少一个CPU芯粒,其用于管控深度学习任务相关数据的收发与任务执行流程,并且所述CPU芯粒设有电光通信端口;多个GPU芯粒,其用于根据深度学习任务相关数据执行深度学习任务,并且所述GPU芯粒设有电光通信端口;多个阵列波导光栅路由器,其用于对以光波承载的深度学习任务相关的数据,其中,所述阵列波导光栅路由器与所述芯粒通过3D堆叠技术封装在不同的芯片层;多个硅光收发器,其每个硅光收发器用于一个芯粒的电光通信端口与对应阵列波导光栅路由器之间的连接与电光信号转换。

    一种远程内存访问的系统及方法

    公开(公告)号:CN115017089A

    公开(公告)日:2022-09-06

    申请号:CN202210617225.6

    申请日:2022-06-01

    Abstract: 本发明提供一种远程内存访问的系统,包括网络接口设备,该设备包括:加解密模块,用于获取缓冲区的信息,该信息包括缓冲区的唯一标识符、虚拟地址、长度和物理地址,加解密模块针对每个缓冲区生成对应密钥,基于密钥对缓冲区的物理地址进行加密,生成缓冲区的物理地址密文;权限记录模块,用于记录每个缓冲区对应的包含其缓冲区的唯一标识符、虚拟地址、长度和密钥信息的权限验证信息;响应处理模块,用于根据缓冲区的权限验证信息验证请求端对指定缓冲区是否具有访问权限,获取通过验证的请求端所指定缓冲区的物理地址密文解密后得到的指定缓冲区的物理地址;内存访问模块,用于根据指定缓冲区的物理地址授权请求端访问缓冲区的。

    一种多根CPU下的PCIe交换芯片上、下游端口路由表构建方法

    公开(公告)号:CN114265804A

    公开(公告)日:2022-04-01

    申请号:CN202111587159.4

    申请日:2021-12-23

    Abstract: 本发明提供了一种多根CPU下的PCIe交换芯片上、下游游端口路由表构建方法,用于构建上、下游端口路由表,所述PCIe芯片被划分为多个虚拟交换机,每一个虚拟交换机配置有唯一的虚拟机交换标识,每个虚拟交换机均包括一个上游端口和多个下游端口,其中,上游端口路由表构建方法包括:在每个虚拟交换机的上游端口重复执行如下步骤直至完成上游端口到当前虚拟交换机下的所有下游端口的路由表项构建:S1、上游端口捕获与其相连的操作系统下发的包含当前上游端口所属虚拟交换机标识的且与下游端口路由相关的配置包;S2、解析所述配置包中与路由相关的信息并根据解析到的路由相关信息构建当前虚拟交换机下的上游端口路由表项。

    一种基于作业部署信息的链路互连方法和系统

    公开(公告)号:CN109067662A

    公开(公告)日:2018-12-21

    申请号:CN201810700993.1

    申请日:2018-06-29

    Abstract: 本发明涉及一种基于作业部署信息的链路互连方法和系统,包括:获取待运行的作业,为当前作业的分配多个计算节点,获取与计算节点相连的交换节点间的通信概率总和,以及交换节点间的路由路径经过除当前作业以外的其余作业的路由路径数量,根据通信概率总和、路由路径数量,得到多个交换节点间的加权距离;根据多个计算节点的计算资源是否连续,将交换节点间最大加权距离对应的交换节点进行互连。由此本发明解决由于作业部署问题所带来的远距离热点通信问题,对影响网络性能的通信热点准确进行识别,避免对作业与作业间无关交换节点的计算,能更快速地得到互连结果。

    一种支持远程数据直接访问协议的网络接口

    公开(公告)号:CN116722884A

    公开(公告)日:2023-09-08

    申请号:CN202310078726.6

    申请日:2023-02-08

    Abstract: 本发明提供一种支持远程数据直接访问协议的网络接口,包括支持远程数据直接访问协议的网络接口,其特征在于,该网络接口包括:控制管理模块,用于对RDMA通信过程进行管理,RDMA通信包括基于RDMA可靠连接模式的RDMA可靠连接通信;上下文信息管理模块,用于对RDMA通信过程在网络接口的缓存中维护的连接上下文信息进行管理,其中,在根据预设的聚合规则确定基于RDMA可靠连接模式的多个原生连接所对应的多条原生连接上下文信息是可聚合的情况下,采用聚合连接上下文信息代替可聚合的多条原生连接上下文信息,以减少对网络接口的缓存空间占用;数据传输模块,用于根据原生连接上下文信息或者聚合连接上下文信息执行RDMA可靠连接通信的数据传输过程。

Patent Agency Ranking