一种数据处理方法、装置、设备、存储介质及分布式集群

    公开(公告)号:CN117112466B

    公开(公告)日:2024-02-09

    申请号:CN202311386368.1

    申请日:2023-10-25

    Abstract: 本发明涉及计算机技术领域,具体公开了一种数据处理方法、装置、设备、存储介质及分布式集群,基于计算机快速互联协议实现主机安装的第一加速器的内存成为共享内存,在主机控制器接收到计算任务时先将共享内存的控制权切换至发送方设备,以使发送方设备将计算任务的待处理数据写入共享内存,再将控制权切换至主机安装的第二加速器,以使第二加速器从共享内存中读取待处理数据完成计算任务,将共享内存的控制权再切换至发送方设备或主机控制器以自共享内存中读取计算任务的计算结果,使加速器方案中数据输入和输出均直接基于共享内存进行,无需在主机内存和加速器内存间搬移,从而缩短了数据导入导出的路径,由此提高了加速器

    深度神经网络模型的链路剪枝方法、装置、设备和介质

    公开(公告)号:CN116992943B

    公开(公告)日:2024-02-09

    申请号:CN202311255746.2

    申请日:2023-09-27

    Abstract: 本发明涉及深度学习技术领域,公开了一种深度神经网络模型的链路剪枝方法、装置、设备和介质,根据待剪枝模型对应的模型图结构,构建第一链路图。在出现具有链接关系的目标相邻顶点时,向第一链路图中填充目标相邻顶点对应的链接关系;直至遍历完第一链路图中的所有相邻顶点,将最终的第一链路图作为第二链路图。基于剪枝需求,从第二链路图中确定出与剪枝需求相关联的所有待剪枝层和剪枝维度,按照各待剪枝层对应的剪枝维度对待剪枝层进行剪枝,从而快速完成待剪枝模型的链路剪枝。通过构建反映各顶点之间链接关系的第二链路图,可以快速自动化实现结构化剪枝策略,极大的提升了模型剪枝的效率。

    深度神经网络模型的链路剪枝方法、装置、设备和介质

    公开(公告)号:CN116992943A

    公开(公告)日:2023-11-03

    申请号:CN202311255746.2

    申请日:2023-09-27

    Abstract: 本发明涉及深度学习技术领域,公开了一种深度神经网络模型的链路剪枝方法、装置、设备和介质,根据待剪枝模型对应的模型图结构,构建第一链路图。在出现具有链接关系的目标相邻顶点时,向第一链路图中填充目标相邻顶点对应的链接关系;直至遍历完第一链路图中的所有相邻顶点,将最终的第一链路图作为第二链路图。基于剪枝需求,从第二链路图中确定出与剪枝需求相关联的所有待剪枝层和剪枝维度,按照各待剪枝层对应的剪枝维度对待剪枝层进行剪枝,从而快速完成待剪枝模型的链路剪枝。通过构建反映各顶点之间链接关系的第二链路图,可以快速自动化实现结构化剪枝策略,极大的提升了模型剪枝的效率。

    直接内存访问描述符处理方法、系统、装置、设备及介质

    公开(公告)号:CN116610608B

    公开(公告)日:2023-11-03

    申请号:CN202310884534.4

    申请日:2023-07-19

    Abstract: 本发明公开了一种直接内存访问描述符处理方法、系统、装置、设备及介质,涉及现场可编程与门阵列技术领域,获取目标加速功能单元传输的待处理的第一直接内存访问描述符;获取已有的第二直接内存访问描述符;若能合并第一直接内存访问描述符与第二直接内存访问描述符,则将第一直接内存访问描述符合并至第二直接内存访问描述符;若不结束合并操作,则返回执行获取目标加速功能单元传输的待处理的第一直接内存访问描述符及之后的步骤;若结束合并操作,则传输第二直接内存访问描述符至外围器件快速互连IP核进行处理。本发明可以使得现场可编程与门阵列一次性对多个直接内存访问描述符进行处理,提高了计算能力。

    一种异构设备的高速通信方法、装置和异构通信系统

    公开(公告)号:CN116886751A

    公开(公告)日:2023-10-13

    申请号:CN202311127077.0

    申请日:2023-09-04

    Abstract: 本申请提供一种异构设备的高速通信方法、装置和异构通信系统,涉及通信领域,包括:所述高速互连远端虚拟化处理器接收高速互连操作;所述高速互连远端虚拟化处理器将所述高速互连操作转换为对目标异构设备上异构加速器的寄存器操作和内存数据搬移操作;所述高速互连远端虚拟化处理器将所述寄存器操作和所述内存数据搬移操作转换为通信请求;所述高速互连远端虚拟化处理器通过所述通信请求与所述目标异构设备进行通信,以执行所述寄存器操作和所述内存数据搬移操作。本申请实现远端异构设备状态到本地的映射,不必依赖软件,对通信设备无性能损伤,降低了通信时延以及对通信设备的计算资源占用,保障了通信性能和本地应用业务运行性能。

    一种图像生成方法、装置、设备及介质

    公开(公告)号:CN116701692A

    公开(公告)日:2023-09-05

    申请号:CN202310974784.7

    申请日:2023-08-04

    Abstract: 本发明公开了一种图像生成方法、装置、设备及介质,应用于图像生成技术领域,包括:将第一输入数据输入至目标扩散模型进行推理,并在推理过程中获取每次迭代的输出结果;第一输入数据包括第一噪声和第一文本信息;基于相邻两次迭代的输出结果计算散度,得到散度序列;对所述散度序列进行分组以得到散度组,并依次对每个散度组对应的推理阶段中的目标扩散模型进行参数量化;推理阶段为散度组中各散度对应的迭代次数所对应的推理阶段;基于第二输入数据以及参数量化后的目标扩散模型生成图像;所述第二输入数据包括第二噪声和第二文本信息。能够解决模型推理速度慢的问题,提升模型推理速度,进而提升图像的生成效率。

    连接处理方法、系统、电子设备、服务器及可读存储介质

    公开(公告)号:CN115190175A

    公开(公告)日:2022-10-14

    申请号:CN202210840515.7

    申请日:2022-07-18

    Abstract: 本申请公开了一种连接处理方法、系统、电子设备、服务器及可读存储介质,涉及服务器领域,该连接处理方法包括对接收到的客户端发送的TCP连接进行解析,得到客户端数据;将客户端数据存储到DDR中与TCP连接对应的预设存储空间,并判断预设存储空间中存储的客户端数据是否满足TLS处理条件;若是,对预设存储空间中存储的所有客户端数据进行TLS计算处理,将处理后的客户端数据发送至服务端;当接收到服务端反馈的服务端数据,对服务端数据进行TLS计算处理,将处理后的服务端数据封包发送至客户端。本申请能够减少设计复杂度,避免大量断包处理、状态存储及回读,同时释放了CPU资源,从而保证服务器性能。

    一种计算资源的远程映射方法、装置、设备及存储介质

    公开(公告)号:CN112416840A

    公开(公告)日:2021-02-26

    申请号:CN202011229875.0

    申请日:2020-11-06

    Abstract: 本申请公开了一种计算资源的远程映射方法,应用于服务器中,包括:识别出FPGA BOX中的各个FPGA异构加速卡;通过各FPGA异构加速卡的网络接口建立与各FPGA异构加速卡的网络通信连接以及各FPGA异构加速卡之间的网络通信连接;将各FPGA异构加速卡映射到服务器中;为建立的网络通信连接建立网络传输并将通过PCIE进行的控制流及数据流迁移到网络传输中;通过建立的网络传输,将目标应用部署在FPGA BOX中,并在运行时通过网络传输与FPGA BOX进行数据交互。应用本申请的方案,突破了PCIE插槽的限制且降低了传输路径。本申请还提供了一种计算资源的远程映射装置、设备及存储介质,具有相应效果。

    设备互联系统、数据处理方法、装置及设备、介质和产品

    公开(公告)号:CN119396744A

    公开(公告)日:2025-02-07

    申请号:CN202411505240.7

    申请日:2024-10-25

    Abstract: 本申请公开了一种设备互联系统、数据处理方法、装置及设备、介质和产品,涉及数据处理技术领域,该设备互联系统包括处理器、多个计算设备,处理器连接处理器内存,计算设备连接计算设备内存,处理器与多个计算设备之间通过符合预设协议的总线连接;计算设备包括目标端口,不同的计算设备之间通过目标端口直接连接,不同的计算设备之间通过目标端口直接传输数据;处理器内存和多个计算设备内存采用统一编址的方式进行编址,计算设备内存被访问时,通过对应的计算设备在统一编址与计算设备的内部地址空间之间进行地址映射。本申请提高了不同计算设备之间的数据传输效率,简化了地址的访问方式和数据传输方式。

    一种数据传输方法、装置、设备、介质和产品

    公开(公告)号:CN118427151B

    公开(公告)日:2024-09-20

    申请号:CN202410895828.1

    申请日:2024-07-05

    Abstract: 本发明涉及远程直接数据存取技术领域,公开了一种数据传输方法、装置、设备、介质和产品,根据队列对号读取第一随机存储器的数据发送表项;从空闲指针存储队列中获取当前工作队列事件在第二随机存储器的新地址;在数据发送表项无效时,对各表项的信息进行更新,并将工作队列事件数据写入数据操作表项;将队列对号写入调度信息存储队列。在数据发送表项有效时,对各表项进行更新;根据新地址在第二随机存储器上建立新的数据操作表项,并将工作队列事件数据写入新的数据操作表项。通过使用随机存储器实现工作队列事件的处理,相比于寄存器,随机存储器能够存储更多的信息,从而在不影响RDMA数据传输性能的同时提高硬件QP数量。

Patent Agency Ranking