-
公开(公告)号:CN119473627A
公开(公告)日:2025-02-18
申请号:CN202411920717.8
申请日:2024-12-25
Applicant: 鹏城实验室
IPC: G06F9/50
Abstract: 本申请实施例提供了一种服务器集群的能效比调优方法、装置、设备及存储介质,属于计算机处理技术领域。该方法包括:基于已有的能效比信息和相应的调控参数集合,构建多个处理器的调控参数与服务器集群的能效比之间分布关系的分布模型,基于分布模型构建用于评估调控参数集合质量的采集函数;在最优化采集函数的前提下,基于分布模型对已有能效比信息之外的其他调控参数集合进行采样,确定服务器集群在被采样的调控参数集合下工作时新的能效比信息;从更新后多个已有的能效比信息中确定满足预设能效比要求的目标能效比信息,并控制服务器集群在目标调控参数集合下工作。本申请能够在提高服务器集群的能效比、减少能源消耗。
-
公开(公告)号:CN119204130A
公开(公告)日:2024-12-27
申请号:CN202411494384.7
申请日:2024-10-24
Applicant: 鹏城实验室
IPC: G06N3/063 , G06N3/08 , G06F15/173
Abstract: 本申请实施例公开一种智能计算系统架构,其中,计算板中包括多个第一网络芯片、多个神经网络处理器和多个中央处理器,多个神经网络处理器和多个中央处理器通过多个第一网络芯片通信连接构成第一计算网络层;计算框包含多个计算板和多个交换板,多个计算板与多个交换板通信连接构成第二计算网络层;计算柜至少包括两个计算框;网络柜与计算柜通信连接、网络柜和存储柜通信连接构成第三计算网络层,网络柜中包括基于第三计算网络层构建的第四计算网络层,第一计算网络层、第二计算网络层、第三计算网络层和第四计算网络层构成计算网络,计算网络用于人工智能模型训练过程中的数据传输。该智能计算系统架构能够提高对人工智能模型的训练效率。
-
公开(公告)号:CN116627433B
公开(公告)日:2024-01-09
申请号:CN202310881075.4
申请日:2023-07-18
Applicant: 鹏城实验室
Abstract: 本申请提供了一种AI处理器实时的参数预测方法、系统、设备及介质,属于人工智能技术领域。方法包括:在AI处理器上运行目标应用程序,在建模阶段,采集AI处理器运行过程中的基本参数;实时通过AI处理器对应的非侵入式调节工具调节基本参数,并在实时调节过程中获取各个基本参数对应的目标运行参数;基于多个目标运行参数与对应的基本参数进行拟合操作,建立由基本参数映射到目标运行参数的函数模型;在预测阶段,获取实时的基本参数,并将实时的基本参数输入到函数模型中,得到预测的目标运行参数,以根据预测的目标运行参数确定参数预测结
-
公开(公告)号:CN119938245A
公开(公告)日:2025-05-06
申请号:CN202411755936.5
申请日:2024-12-02
Applicant: 鹏城实验室
Abstract: 本申请实施例提供了一种基于智算集群的任务处理方法、装置、设备及存储介质。方法包括:获取待处理任务,并确定对应的智算集群;从智算集群中确定多个第一处理器和多个第二处理器,每个第一处理器对应的第一运行频率大于每个第二处理器对应的第二运行频率;通过第一运行频率对应的多个第一处理器,对待处理任务进行预填充处理,得到中间特征,并将中间特征传输至第一处理器与第二处理器共享使用的中间数据暂存区;当检测到中间数据暂存区更新时,通过第二运行频率对应的多个第二处理器,从中间数据暂存区中获取中间特征并进行解码处理,得到每个第二处理器的解码结果;依序输出每个第二处理器的解码结果。以此,能够在根源上节约能耗。
-
公开(公告)号:CN119473627B
公开(公告)日:2025-04-01
申请号:CN202411920717.8
申请日:2024-12-25
Applicant: 鹏城实验室
IPC: G06F9/50
Abstract: 本申请实施例提供了一种服务器集群的能效比调优方法、装置、设备及存储介质,属于计算机处理技术领域。该方法包括:基于已有的能效比信息和相应的调控参数集合,构建多个处理器的调控参数与服务器集群的能效比之间分布关系的分布模型,基于分布模型构建用于评估调控参数集合质量的采集函数;在最优化采集函数的前提下,基于分布模型对已有能效比信息之外的其他调控参数集合进行采样,确定服务器集群在被采样的调控参数集合下工作时新的能效比信息;从更新后多个已有的能效比信息中确定满足预设能效比要求的目标能效比信息,并控制服务器集群在目标调控参数集合下工作。本申请能够在提高服务器集群的能效比、减少能源消耗。
-
公开(公告)号:CN119356891B
公开(公告)日:2025-04-01
申请号:CN202411930328.3
申请日:2024-12-26
Applicant: 鹏城实验室
IPC: G06F9/50
Abstract: 本申请实施例提供集群中服务器的节能控制方法、装置、设备和存储介质,涉及服务器技术领域。该方法获取集群中每个处于休眠状态的休眠服务器的总休眠时长,获取每个休眠服务器的均衡时长,选取总休眠时长大于或等于均衡时长的休眠服务器作为待唤醒服务器,控制至少一个待唤醒服务器退出休眠状态。利用均衡时长作为评估是否结束休眠状态的标准,确定在何种情况下唤醒休眠服务器能够最有效地降低能耗。从集群中挑选出具有最大潜在节能价值的服务器来执行休眠或唤醒操作,而非仅仅基于服务器是否处于闲置状态做决策。不仅实现了更加精细化的能源管理,同时也最大限度地减少对系统处理性能的影响,从而提升整体能效水平。
-
公开(公告)号:CN119356891A
公开(公告)日:2025-01-24
申请号:CN202411930328.3
申请日:2024-12-26
Applicant: 鹏城实验室
IPC: G06F9/50
Abstract: 本申请实施例提供集群中服务器的节能控制方法、装置、设备和存储介质,涉及服务器技术领域。该方法获取集群中每个处于休眠状态的休眠服务器的总休眠时长,获取每个休眠服务器的均衡时长,选取总休眠时长大于或等于均衡时长的休眠服务器作为待唤醒服务器,控制至少一个待唤醒服务器退出休眠状态。利用均衡时长作为评估是否结束休眠状态的标准,确定在何种情况下唤醒休眠服务器能够最有效地降低能耗。从集群中挑选出具有最大潜在节能价值的服务器来执行休眠或唤醒操作,而非仅仅基于服务器是否处于闲置状态做决策。不仅实现了更加精细化的能源管理,同时也最大限度地减少对系统处理性能的影响,从而提升整体能效水平。
-
公开(公告)号:CN119011512A
公开(公告)日:2024-11-22
申请号:CN202411473266.8
申请日:2024-10-22
Applicant: 鹏城实验室
IPC: H04L49/112 , H04L49/25 , H04L47/125
Abstract: 本申请实施例提供一种数据传输方法、装置、存储介质及计算机设备,通过获取未配置于同一计算板的第一处理器向第二处理器传输处理数据的传输指令;从与第一处理器建立有第一通信链路的计算板组网芯片中,确定第一目标计算板组网芯片;从与第一目标计算板组网芯片建立有第二通信链路的交换板组网芯片中,确定目标交换板组网芯片;确定与目标交换板组网芯片建立有第二通信链路,且与第二处理器建立有第一通信链路的第二目标计算板组网芯片;基于第一目标计算板组网芯片、任一目标交换板组网芯片以及第二目标计算板组网芯片建立数据传输路径,并通过数据传输路径对处理数据进行传输,通过不同的组网芯片建立出灵活的数据传输路径,提高数据传输效率。
-
公开(公告)号:CN116627433A
公开(公告)日:2023-08-22
申请号:CN202310881075.4
申请日:2023-07-18
Applicant: 鹏城实验室
Abstract: 本申请提供了一种AI处理器实时的参数预测方法、系统、设备及介质,属于人工智能技术领域。方法包括:在AI处理器上运行目标应用程序,在建模阶段,采集AI处理器运行过程中的基本参数;实时通过AI处理器对应的非侵入式调节工具调节基本参数,并在实时调节过程中获取各个基本参数对应的目标运行参数;基于多个目标运行参数与对应的基本参数进行拟合操作,建立由基本参数映射到目标运行参数的函数模型;在预测阶段,获取实时的基本参数,并将实时的基本参数输入到函数模型中,得到预测的目标运行参数,以根据预测的目标运行参数确定参数预测结果。本申请可以在AI处理器上在线部署运行,无需额外的计算资源,预测的结果可靠性高。
-
公开(公告)号:CN116074179A
公开(公告)日:2023-05-05
申请号:CN202310203989.5
申请日:2023-03-06
Applicant: 鹏城实验室
IPC: H04L41/044 , H04L41/042 , H04L41/16 , H04L67/2876 , H04L67/2885
Abstract: 本发明公开了一种基于CPU‑NPU协同的高扩展节点系统及训练方法,所述系统包括:通用算力模块、AI算力模块、层次访存模块、数据缓存模块和网络接口模块;通用算力模块和AI算力模块进行分组互连,用于AI节点内片间互连的扩展;层次访存模块用于在通用算力模块与AI算力模块处理数据时提供通用计算的大内存和AI计算的高带宽;数据缓存模块用于处理通用算力模块在计算时的数据IO吞吐;网络接口模块用于将通用算力模块和AI算力模块在计算时进行分离通信。本发明从AI节点的互连、访存、存储、网络接口出发提出高扩展节点架构,实现AI算力‑层次访存‑片间互连均衡设计,以满足AI大模型训练需求。
-
-
-
-
-
-
-
-
-