一种面向基因比对算法的加速装置

    公开(公告)号:CN109785905A

    公开(公告)日:2019-05-21

    申请号:CN201811546046.8

    申请日:2018-12-18

    Abstract: 本发明提供了一种面向基因比对算法的加速装置。该加速装置包括主机端和多个加速模块,所述加速模块包括多个存储层、垂直切片管理单元和交换网络,其中:所述主机端用于控制向所述加速模块分发基因测序序列和接收基因比对结果;所述加速模块的存储层用于存储基因参考序列;所述加速模块的垂直切片管理单元用于管理将所述多个存储层进行垂直划分所形成的切片以及执行基因比对算法,获得基因比对结果;所述加速模块的交换网络用于控制该加速模块内部的数据交换以及该加速模块与外部的数据交换。本发明的加速装置利用定制结构能够提高基因比对算法的处理速度。

    GPU FFMA指令在双发射模式下的通量测试方法

    公开(公告)号:CN107066706A

    公开(公告)日:2017-08-18

    申请号:CN201710186589.2

    申请日:2017-03-27

    CPC classification number: G06F17/5009 G06F17/5081

    Abstract: 本涉及一种GPU FFMA指令在双发射模式下的通量测试方法和系统,其中该测试方法包括对GPU指令的延迟和通量进行测试,获得该GPU指令的延迟周期和GPU指令通量;根据判断寄存器间是否存在bank冲突,选取无bank冲突的寄存器操作数;通过该GPU指令的延迟周期和GPU指令通量,分析测试该GPU指令中控制码的含义,并根据该控制码的含义,控制开启对应的发射模式和GPU的线程调度,若开启的发射模式为双发射模式,则根据该双发射模式和该寄存器操作数计算测试GPU浮点乘加指令在双发射模式下的通量。本发明通过微基准测试程序测试出GPU参数以及其和性能的对应关系,得出参数和性能的关系,有助于优化GPU上的应用。

    一种确定应用程序计算逻辑的方法及装置

    公开(公告)号:CN105389194A

    公开(公告)日:2016-03-09

    申请号:CN201510681039.9

    申请日:2015-10-19

    Inventor: 谭光明 李强强

    CPC classification number: G06F8/433

    Abstract: 本发明实施例公开了一种确定应用程序计算逻辑的方法及装置,涉及计算机技术领域,实现了一组应用程序的自动分析,提高了对应用程序进行分析的效率,并且扩大了设计得到的体系结构的适用范围。具体方案为:获取一组应用程序中每个应用程序的数据流图;通过分析每个应用程序的数据流图,得到至少一个第一公共频繁子图;根据第一公共频繁子图和每个应用程序的数据流图,计算每个应用程序的流图相似度;根据每个应用程序的流图相似度,得到对一组应用程序中的应用程序的分组结果,分组结果包括至少一个子应用组;根据子应用组中应用程序的数据流图,确定子应用组中应用程序的计算逻辑。本发明用于应用程序的体系结构过程中。

    基于跨异构编程模型的模板优化方法及装置

    公开(公告)号:CN119759359A

    公开(公告)日:2025-04-04

    申请号:CN202411832315.2

    申请日:2024-12-12

    Abstract: 本发明提供了一种基于跨异构编程模型的模板优化方法,包括:获取调优需求参数;根据预定的调优策略和所述调优需求信息,有方向性地生成调优参数种群;根据预定的遗传算法对所述调优参数种群进行搜索,多次迭代搜索直至达到收敛条件,生成对应的优化参数设置;根据预定的模板算子和所述优化参数设置,自动生成优化代码。本发明还提供一种基于跨异构编程模型的模板优化装置、存储介质及电子设备。借此,本发明能够实现基于跨异构编程模型的模板计算自动调优,不仅对于不同硬件平台均能取得较好的模板计算优化效果,而且对不同模式的模板也能找到最适用的优化技术组合。

    一种远程内存访问的系统及方法

    公开(公告)号:CN115017089B

    公开(公告)日:2025-01-28

    申请号:CN202210617225.6

    申请日:2022-06-01

    Abstract: 本发明提供一种远程内存访问的系统,包括网络接口设备,该设备包括:加解密模块,用于获取缓冲区的信息,该信息包括缓冲区的唯一标识符、虚拟地址、长度和物理地址,加解密模块针对每个缓冲区生成对应密钥,基于密钥对缓冲区的物理地址进行加密,生成缓冲区的物理地址密文;权限记录模块,用于记录每个缓冲区对应的包含其缓冲区的唯一标识符、虚拟地址、长度和密钥信息的权限验证信息;响应处理模块,用于根据缓冲区的权限验证信息验证请求端对指定缓冲区是否具有访问权限,获取通过验证的请求端所指定缓冲区的物理地址密文解密后得到的指定缓冲区的物理地址;内存访问模块,用于根据指定缓冲区的物理地址授权请求端访问缓冲区的。

    一种用于大批量训练的优化器
    106.
    发明公开

    公开(公告)号:CN118643886A

    公开(公告)日:2024-09-13

    申请号:CN202410725259.6

    申请日:2024-06-06

    Abstract: 本发明提供了一种用于大批量训练的优化器,包括:梯度获取模块,用于获取批量样本下预设的损失函数的梯度gk,k表示迭代步数;加速度计算模块,用于计算梯度gk与梯度gk‑1的差值的指数移动平均,得到加速度ak,其中,梯度gk‑1为迭代步数为k‑1时的梯度;动量计算模块,用于计算梯度gk和加速度ak的加权和的指数移动平均,得到动量mk;二阶矩计算模块,用于计算梯度gk和加速度ak的加权和的平方的指数移动平均,得到二阶矩vk;等效动量计算模块,用于根据动量mk、二阶矩vk和模型的参数确定等效动量rk;参数更新模块,用于根据等效动量rk更新模型的参数。

    一种RDMA通信设备的上下文访问方法及系统

    公开(公告)号:CN112559436B

    公开(公告)日:2023-11-03

    申请号:CN202011487278.8

    申请日:2020-12-16

    Abstract: 本发明提供了一种RDMA通信设备访问上下文的方法及系统,包括缓存模块、常驻存储模块、访问管理模块。缓存模块,由存储单元及缓存控制单元组成,其功能在于为RDMA通信设备访问上下文信息的非关键字段提供接口。常驻存储模块,其功能在于存储上下文的关键字段信息,供RDMA通信设备访问。访问管理模块,其功能在于对上下文字段信息进行读写控制,保证上下文信息被多个模块访问的一致性。

    GPU集群调度策略模拟方法及GPU集群模拟器

    公开(公告)号:CN113504966B

    公开(公告)日:2023-10-31

    申请号:CN202110690973.2

    申请日:2021-06-22

    Abstract: 本发明提出一种GPU集群调度策略模拟方法,包括:获取模拟GPU集群的集群参数、拟执行的工作负载及对应的调度策略;基于该调度策略,获取该工作负载完成无故障运行的预测时间;根据该集群参数和该预测时间,设定该模拟GPU集群的模拟故障参数;以该调度策略及该模拟故障参数进行该工作负载的故障工作模拟,获取该工作负载在故障工作状态时的运行数据。本发明还提出一种GPU集群模拟器,及一种实现GPU集群调度策略模拟数据处理装置。

    基于循环查询扩展的多监督医学图像检索方法和系统

    公开(公告)号:CN113127661B

    公开(公告)日:2023-09-12

    申请号:CN202110376391.7

    申请日:2021-04-06

    Abstract: 本发明涉及一种基于循环查询扩展的多监督医学图像检索方法,包括:以已知医学图像数据集对卷积神经网络进行训练,获得分类模型;以该分类模型对该已知医学图像数据集进行三元组挖掘,以挖掘出的三元组对该分类模型进行训练,以获得图像检索模型;对于目标医学图像,通过该图像检索模型从该已知医学图像数据集获得检索结果。本发明还涉及一种基于循环查询扩展的多监督医学图像检索系统,以及一种数据处理装置。本发明的多监督医学图像检索方法采用NM三元组挖掘,解决了仅适用标签信息或仅使用相似标签信息不足以满足CBMIR高精度要求的问题,并提出RQE查询扩展方法,进一步提高了医学图像检索的性能,充分利用了检索结果中的信息。

Patent Agency Ranking