-
公开(公告)号:CN119938245A
公开(公告)日:2025-05-06
申请号:CN202411755936.5
申请日:2024-12-02
Applicant: 鹏城实验室
Abstract: 本申请实施例提供了一种基于智算集群的任务处理方法、装置、设备及存储介质。方法包括:获取待处理任务,并确定对应的智算集群;从智算集群中确定多个第一处理器和多个第二处理器,每个第一处理器对应的第一运行频率大于每个第二处理器对应的第二运行频率;通过第一运行频率对应的多个第一处理器,对待处理任务进行预填充处理,得到中间特征,并将中间特征传输至第一处理器与第二处理器共享使用的中间数据暂存区;当检测到中间数据暂存区更新时,通过第二运行频率对应的多个第二处理器,从中间数据暂存区中获取中间特征并进行解码处理,得到每个第二处理器的解码结果;依序输出每个第二处理器的解码结果。以此,能够在根源上节约能耗。
-
公开(公告)号:CN119473627B
公开(公告)日:2025-04-01
申请号:CN202411920717.8
申请日:2024-12-25
Applicant: 鹏城实验室
IPC: G06F9/50
Abstract: 本申请实施例提供了一种服务器集群的能效比调优方法、装置、设备及存储介质,属于计算机处理技术领域。该方法包括:基于已有的能效比信息和相应的调控参数集合,构建多个处理器的调控参数与服务器集群的能效比之间分布关系的分布模型,基于分布模型构建用于评估调控参数集合质量的采集函数;在最优化采集函数的前提下,基于分布模型对已有能效比信息之外的其他调控参数集合进行采样,确定服务器集群在被采样的调控参数集合下工作时新的能效比信息;从更新后多个已有的能效比信息中确定满足预设能效比要求的目标能效比信息,并控制服务器集群在目标调控参数集合下工作。本申请能够在提高服务器集群的能效比、减少能源消耗。
-
公开(公告)号:CN119356891B
公开(公告)日:2025-04-01
申请号:CN202411930328.3
申请日:2024-12-26
Applicant: 鹏城实验室
IPC: G06F9/50
Abstract: 本申请实施例提供集群中服务器的节能控制方法、装置、设备和存储介质,涉及服务器技术领域。该方法获取集群中每个处于休眠状态的休眠服务器的总休眠时长,获取每个休眠服务器的均衡时长,选取总休眠时长大于或等于均衡时长的休眠服务器作为待唤醒服务器,控制至少一个待唤醒服务器退出休眠状态。利用均衡时长作为评估是否结束休眠状态的标准,确定在何种情况下唤醒休眠服务器能够最有效地降低能耗。从集群中挑选出具有最大潜在节能价值的服务器来执行休眠或唤醒操作,而非仅仅基于服务器是否处于闲置状态做决策。不仅实现了更加精细化的能源管理,同时也最大限度地减少对系统处理性能的影响,从而提升整体能效水平。
-
公开(公告)号:CN119356891A
公开(公告)日:2025-01-24
申请号:CN202411930328.3
申请日:2024-12-26
Applicant: 鹏城实验室
IPC: G06F9/50
Abstract: 本申请实施例提供集群中服务器的节能控制方法、装置、设备和存储介质,涉及服务器技术领域。该方法获取集群中每个处于休眠状态的休眠服务器的总休眠时长,获取每个休眠服务器的均衡时长,选取总休眠时长大于或等于均衡时长的休眠服务器作为待唤醒服务器,控制至少一个待唤醒服务器退出休眠状态。利用均衡时长作为评估是否结束休眠状态的标准,确定在何种情况下唤醒休眠服务器能够最有效地降低能耗。从集群中挑选出具有最大潜在节能价值的服务器来执行休眠或唤醒操作,而非仅仅基于服务器是否处于闲置状态做决策。不仅实现了更加精细化的能源管理,同时也最大限度地减少对系统处理性能的影响,从而提升整体能效水平。
-
公开(公告)号:CN119011512A
公开(公告)日:2024-11-22
申请号:CN202411473266.8
申请日:2024-10-22
Applicant: 鹏城实验室
IPC: H04L49/112 , H04L49/25 , H04L47/125
Abstract: 本申请实施例提供一种数据传输方法、装置、存储介质及计算机设备,通过获取未配置于同一计算板的第一处理器向第二处理器传输处理数据的传输指令;从与第一处理器建立有第一通信链路的计算板组网芯片中,确定第一目标计算板组网芯片;从与第一目标计算板组网芯片建立有第二通信链路的交换板组网芯片中,确定目标交换板组网芯片;确定与目标交换板组网芯片建立有第二通信链路,且与第二处理器建立有第一通信链路的第二目标计算板组网芯片;基于第一目标计算板组网芯片、任一目标交换板组网芯片以及第二目标计算板组网芯片建立数据传输路径,并通过数据传输路径对处理数据进行传输,通过不同的组网芯片建立出灵活的数据传输路径,提高数据传输效率。
-
公开(公告)号:CN118245184A
公开(公告)日:2024-06-25
申请号:CN202410310666.0
申请日:2024-03-14
Applicant: 鹏城实验室
Abstract: 本申请涉及信息协同处理领域,提供了一种任务协同调度方法、装置、设备以及介质,任务协同调度方法应用于包括有多个节点的协同计算系统,方法首先基于目标任务的原始任务描述信息对目标任务进行拆分编排,得到多个子任务和子任务之间的任务逻辑拓扑关系,之后根据节点的节点信息从协同计算系统中为每个子任务分配对应的执行节点,生成子任务描述信息,最后下发子任务描述信息到执行节点,使得各个执行节点能够依据编排得到的逻辑拓扑关系完成所有子任务,得到目标任务的输出结果,能够覆盖多元化的任务协同调度场景和兼容不同能力的设备接入与调度,满足不同业务类型、规模的协同处理需求。
-
公开(公告)号:CN117994617A
公开(公告)日:2024-05-07
申请号:CN202410103211.1
申请日:2024-01-24
Applicant: 鹏城实验室
IPC: G06V10/80 , G06V10/776 , G06V10/44 , G06V10/96
Abstract: 本申请公开了视觉模型的预训练方法、装置、电子设备及存储介质,涉及人工智能技术领域。将获取的第一分辨率的实例图像转换为第二分辨率的掩码图像,将实例图像输入至代理模型提取实例级特征,将掩码图像输入至视觉模型提取图像级特征,并将实例级特征和图像级特征进行融合得到融合特征。利用代理模型根据融合特征进行目标检测得到检测结果,并计算目标检测损失。同时根据图像级特征对掩码图像进行重建得到重建图像,并计算重建损失。最后根据重建损失和目标检测损失更新视觉模型的视觉模型权重,直至得到预训练完成的视觉模型。可以高效地对视觉模型进行实例级预训练,有效提高视觉模型在下游精细化任务上的泛化性。
-
公开(公告)号:CN117291237A
公开(公告)日:2023-12-26
申请号:CN202311173877.6
申请日:2023-09-11
Applicant: 鹏城实验室
IPC: G06N3/049 , G06N3/0464
Abstract: 本申请实施例提供了一种数据流映射搜索方法、系统、电子设备及存储介质,从脉冲神经网络卷积过程中获取数据类型以及对应划分的维度数据,并形成多个数据流映射集合;获取集群节点数量以及处理器核心数,确定数据集群的总并行线程数,并创建并行线程;根据数据流映射集合和总并行线程数得到每个并行线程的数据流映射搜索数,为每个并行线程分配数据流映射,并根据每个存储层次的预设存储规则数据流映射进行筛选,得到多个候选数据流映射;在每个并行线程中,对每个候选数据流映射进行能量计算,并将能量计算结果与历史能量计算结果进行比较,若能量计算结果低于历史能量计算结果,将能量计算结果对应的候选数据流映射作为目标数据流映射。
-
公开(公告)号:CN117215735A
公开(公告)日:2023-12-12
申请号:CN202310969665.2
申请日:2023-08-01
Applicant: 鹏城实验室
Abstract: 本申请公开了一种任务调度方法、电子设备及存储介质,应用于人工智能领域,包括:由计算节点获取训练数据和模型超参数;由计算节点将训练数据和模型超参数输入至训练好的元学习模型,得到模型功耗;由计算节点根据模型功耗得到节点信息,并将节点信息发送至对应的调度节点;由调度节点根据节点信息将计算节点划分为多个分布式集群,以形成多条传输路径;由计算节点获取任务数据,并通过对应的传输路径对任务数据进行任务调度。本申请实施例通过元学习模型对系统功耗进行预测,以使设备节点层的设备节点对应形成有传输路径,从而降低了任务数据在不同计算节点进行计算的功耗,降低了计算负荷,进而提高了能源利用率,提高了任务执行效率。
-
公开(公告)号:CN117057392A
公开(公告)日:2023-11-14
申请号:CN202310928096.7
申请日:2023-07-26
Applicant: 鹏城实验室
Abstract: 本申请公开了iTPN模型在MindSpore框架的适配方法、装置及存储介质,适配方法通过将训练数据转换成适于输入MindSpore框架的MindRecord文件并对转换后的数据进行数据增强,然后将iTPN模型中Pytorch的模型参数和模型函数映射到MindSpore框架中,并按照各层权重进行精度转换以适于MindSpore框架的计算精度,还设定逐层学习率,在实际训练过程中基于当前层的学习率进行优化,并实现数据并行、优化器并行和梯度合并处理,节省了GPU的计算负担,加快了适配到MindSpore框架后的计算效率,适配后的模型能够作为基础网络用于多种下游任务,从而提升下游任务的性能精度。
-
-
-
-
-
-
-
-
-