-
公开(公告)号:CN119938318A
公开(公告)日:2025-05-06
申请号:CN202411946612.X
申请日:2024-12-25
Applicant: 鹏城实验室
IPC: G06F9/50 , G06N3/063 , G06F18/2415 , G06F18/214
Abstract: 本申请实施例提供了一种神经网络处理器的能效比调优方法以及相关设备,属于计算机处理技术领域,该方法包括:获取神经网络处理器的矩阵参数集合,并基于矩阵参数集合确定神经网络处理器的工作能效比函数;基于工作能效比函数和矩阵参数集合构建贝叶斯分布模型,其中,贝叶斯分布模型包括用于评估矩阵参数集合质量的采集函数;利用采集函数对矩阵参数集合进行贝叶斯优化处理,得到目标矩阵参数集合;基于目标矩阵参数集合控制神经网络处理器进入运行状态。本申请能够提高NPU的能效比、减少能源消耗。
-
公开(公告)号:CN119537027B
公开(公告)日:2025-04-08
申请号:CN202411926301.7
申请日:2024-12-25
Applicant: 鹏城实验室
IPC: G06F9/50
Abstract: 本申请实施例提供了一种基于智算集群的资源分配方法、装置、设备及存储介质。方法包括:确定智算服务节点集群处理每个任务队列关联的历史任务的平均处理时长及任务分配率;每个任务队列对应一个目标约束函数,每个目标约束函数用于在满足当前任务队列对应的任务延迟处理比例阈值下,限定平均处理时长变量、任务分配率变量以及服务节点总量变量,与当前任务队列的服务节点分配权重变量之间的函数关系;对每个任务队列的目标约束函数进行计算得到对应的目标服务节点分配权重,分配对应的服务器节点子集;按照待处理任务的最大任务延迟阈值,确定对应分配的任务队列并处理对应任务队列中的待处理任务。以此能够降低系统延时,充分利用系统资源。
-
公开(公告)号:CN119938245A
公开(公告)日:2025-05-06
申请号:CN202411755936.5
申请日:2024-12-02
Applicant: 鹏城实验室
Abstract: 本申请实施例提供了一种基于智算集群的任务处理方法、装置、设备及存储介质。方法包括:获取待处理任务,并确定对应的智算集群;从智算集群中确定多个第一处理器和多个第二处理器,每个第一处理器对应的第一运行频率大于每个第二处理器对应的第二运行频率;通过第一运行频率对应的多个第一处理器,对待处理任务进行预填充处理,得到中间特征,并将中间特征传输至第一处理器与第二处理器共享使用的中间数据暂存区;当检测到中间数据暂存区更新时,通过第二运行频率对应的多个第二处理器,从中间数据暂存区中获取中间特征并进行解码处理,得到每个第二处理器的解码结果;依序输出每个第二处理器的解码结果。以此,能够在根源上节约能耗。
-
公开(公告)号:CN119249052A
公开(公告)日:2025-01-03
申请号:CN202411336993.X
申请日:2024-09-24
Applicant: 鹏城实验室
Abstract: 本申请实施例提出的并行计算硬件中矩阵运算的数据处理方法及相关设备,方法包括:首先,获取第一单精度矩阵的第一半精度矩阵和第二单精度矩阵的第二半精度矩阵、第二单精度矩阵与第二半精度矩阵之间的第二误差矩阵、第二误差矩阵中的多个第二分块误差矩阵,并存储至并行计算硬件的L1缓冲区中;逐一获取第一半精度矩阵中第一分块矩阵,存储至L1缓冲区中,并进一步进行矩阵运算得到第一结果矩阵,获取第二结果矩阵和第三结果矩阵,累加第一结果矩阵、第二结果矩阵以及第三结果矩阵得到单精度目标矩阵,并将单精度目标矩阵作为第一单精度矩阵和第二单精度矩阵进行矩阵乘法运算的结果,有效地提高了单精度矩阵乘法的精准度和计算速率。
-
公开(公告)号:CN119537027A
公开(公告)日:2025-02-28
申请号:CN202411926301.7
申请日:2024-12-25
Applicant: 鹏城实验室
IPC: G06F9/50
Abstract: 本申请实施例提供了一种基于智算集群的资源分配方法、装置、设备及存储介质。方法包括:确定智算服务节点集群处理每个任务队列关联的历史任务的平均处理时长及任务分配率;每个任务队列对应一个目标约束函数,每个目标约束函数用于在满足当前任务队列对应的任务延迟处理比例阈值下,限定平均处理时长变量、任务分配率变量以及服务节点总量变量,与当前任务队列的服务节点分配权重变量之间的函数关系;对每个任务队列的目标约束函数进行计算得到对应的目标服务节点分配权重,分配对应的服务器节点子集;按照待处理任务的最大任务延迟阈值,确定对应分配的任务队列并处理对应任务队列中的待处理任务。以此能够降低系统延时,充分利用系统资源。
-
公开(公告)号:CN119517161A
公开(公告)日:2025-02-25
申请号:CN202411767921.0
申请日:2024-11-30
Applicant: 鹏城实验室
Abstract: 本申请实施例提供了一种药物响应预测方法、装置、计算机设备及可读存储介质。包括:进行基因测序得到目标细胞的多层次组学特征;将多个目标基因确定为多个图节点,任意两个目标基因之间的多种属性关联关系作为多条交互边,生成多边缘图;每个目标基因关联对应的多层次组学特征作为节点特征;针对每个图节点通过多条交互边进行消息传递,得到的相邻节点特征对每个图节点中的节点特征进行更新,对更新后的多边缘图进行特征映射,得到第一细胞特征向量;通过目标模型的全连接层对第一细胞特征向量和药物化合物的药物特征向量融合得到的第一融合向量进行预测,得到药物化合物对目标细胞的预测药物响应结果。以此,能够提高对药物响应预测的准确性。
-
公开(公告)号:CN119476379A
公开(公告)日:2025-02-18
申请号:CN202411414343.2
申请日:2024-10-10
Applicant: 鹏城实验室
Abstract: 本申请实施例公开一种数据处理方法、装置、计算机设备及存储介质,神经网络处理器包括全局内存、中转缓存区和多个计算单元,通过对待更新矩阵进行分块处理得到多个待更新子矩阵,并将多个待更新子矩阵均衡分配给每个计算单元;在第一矩阵中确定出每个待更新子矩阵对应的第一子矩阵,将第一子矩阵从全局内存中搬运至每个待更新子矩阵对应的计算单元的预设缓存区;在第二矩阵中确定每个待更新子矩阵对应的第二子矩阵,将第二子矩阵从全局内存中搬运至中转缓存区;从预设缓存区中获取目标第一子矩阵,从中转缓存区中获取目标第二子矩阵;通过计算单元对每个待更新子矩阵、目标第一子矩阵和目标第二子矩阵进行通用矩阵乘运算,得到更新子矩阵。
-
公开(公告)号:CN116089043A
公开(公告)日:2023-05-09
申请号:CN202310076808.7
申请日:2023-01-13
Applicant: 鹏城实验室
Abstract: 本发明公开了一种异构应用系统视频分析任务调度方法、装置、终端及介质,包括:获取视频分析任务所需的算力参数和视频解码参数;根据所需的算力参数和视频解码参数以及各计算模块的算力参数和视频编解码参数,确定所述视频分析任务的调度策略以及对应的计算模块;根据所述调度策略将所述视频分析任务中的视频解码任务和计算任务调度至对应的计算模块,以执行对应的任务。本发明通过异构应用系统中多计算模块之间的视频数据通信传输,调度多个计算模块完成视频分析任务,实现异构应用系统算力和视频编解码能力的最大利用,提高系统支持的视频分析任务处理路数,提高了视频分析的效率。
-
-
-
-
-
-
-