一种基于序列生成的异构芯片任务调度方法以及装置

    公开(公告)号:CN116932175B

    公开(公告)日:2024-01-09

    申请号:CN202311208268.X

    申请日:2023-09-19

    Abstract: 本说明书公开了一种基于序列生成的异构芯片任务调度方法以及装置,针对每个待调度任务,确定该待调度任务在各芯片上分别对应的执行时间,再确定各芯片分别对应的空闲时刻,根据各芯片分别对应的空闲时刻、各待调度任务在各芯片上分别对应的执行时间,生成调度序列,以根据调度序列调度各芯片执行各待调度任务。在包含异构芯片的计算集群中存在处于空闲状态的芯片的情况下,尽可能为该处于空闲状态的芯片分配与其匹配的任务,保证了任务执行效率。

    一种介质访问控制层、通信方法和系统

    公开(公告)号:CN116627894B

    公开(公告)日:2023-10-20

    申请号:CN202310893529.X

    申请日:2023-07-20

    Abstract: 本申请涉及一种介质访问控制层、通信方法和系统,其中,介质访问控制层包括:数据链路协议桥模块,用于建立所述片内通信接口和所述片间通信接口之间的逻辑数据链路;介质访问控制器模块,用于将所述片内通信接口数据编码为所述片间通信接口的规格所对应的帧数据,并将所述帧数据传输至所述片间通信接口;配置模块,用于接收并解析所述数据链路协议桥模块传输的配置包,以配置所述片间通信接口。本申请解决了介质访问控制层无法兼容市面上的各种不同规格的片间通信接口,导致无法复用的问题。

    双面式芯片组及其散热方法
    13.
    发明公开

    公开(公告)号:CN116247019A

    公开(公告)日:2023-06-09

    申请号:CN202310088592.6

    申请日:2023-01-16

    Abstract: 本申请涉及高功率密度芯片嵌入式冷却技术领域,特别是涉及一种双面式芯片组。双面式芯片组包括第一基板,中间基板,第二基板。第一基板上加工有第一芯片;第二基板上加工有第二芯片,中间基板开设有入流口、出流口、入流通道以及出流通道,冷却介质从入流口通入入流通道,然后直接流入第一换热腔和第二换热腔进行换热,升温后的冷却介质在出流通道汇流,汇流后的冷却介质再从出流口排出,本申请通过对第一基板和第二基板以及中间基板的加工,在其本体上形成冷却通道,无需额外的冷却管路,且第一芯片以及第二芯片贴合各自所在的基板,使得整个双面式芯片组具有较高的换热效率,因此大大提升了芯片的散热能力。

    一种任务执行方法、装置、存储介质及电子设备

    公开(公告)号:CN116225669A

    公开(公告)日:2023-06-06

    申请号:CN202310509060.5

    申请日:2023-05-08

    Abstract: 本说明书公开了一种任务执行方法、装置、存储介质及电子设备,可以预先确定出所有可以并行执行的算子组合,进而可以在响应于用户发起的任务请求进行任务执行时,确定需要执行该任务对应的各可执行算子与正在执行其他任务的芯片正在执行的其他任务的算子是否有匹配的可以并行执行的算子组合,若有,则可以通过正在执行其他任务的芯片并行执行该任务请求对应的任务,从而可以提升芯片的计算资源的利用率。

    一种面向芯粒的深度神经网络流水线并行调度方法及装置

    公开(公告)号:CN115421897B

    公开(公告)日:2023-03-24

    申请号:CN202211381782.9

    申请日:2022-11-07

    Abstract: 本发明公开了一种面向芯粒的深度神经网络流水线并行调度方法及装置,该方法包括:获取深度神经网络和芯粒拓扑结构;根据所述深度神经网络,构造深度神经网络计算图并对所述深度神经网络计算图进行缩减;根据缩减后的深度神经网络计算图划分流水线组,得到流水线组图;根据所述流水线组图和芯粒拓扑结构,划分流水线并行区域;根据划分后的流水线并行区域和所述芯粒拓扑结构确定深度神经网络流水线并行调度策略;按照所述深度神经网络流水线并行调度策略,将所述深度神经网络部署到芯粒上,执行深度神经网络流水线并行推理。

    芯粒中神经网络推理的模块化调度方法、装置和计算设备

    公开(公告)号:CN115658274A

    公开(公告)日:2023-01-31

    申请号:CN202211425389.5

    申请日:2022-11-14

    Abstract: 本发明公开了一种芯粒中神经网络推理的模块化调度方法、装置和计算设备,包括:获取在芯粒中进行神经网络推理的调度策略搜索空间;获取并依据神经网络的计算图生成算子深度,依据计算图将算子划分为串行组;依据算子间的数据依赖关系、算子深度和串行组,划分计算图得到数据依赖模块和并行数据依赖模块;计算数据依赖模块的数据依赖复杂度,依据数据依赖复杂度、并行数据依赖模块以及芯粒资源总数计算算子的最大可用资源分配数量,作为调度策略迭代搜索的初始约束;依据调度策略搜索空间和初始约束迭代搜索使得计算开销、算子内和算子间数据传输开销、芯粒多级路由产生的拥塞开销之和最小的数据依赖模块调度策略。

    一种模型训练、代码生成方法、装置、存储介质及设备

    公开(公告)号:CN117828360A

    公开(公告)日:2024-04-05

    申请号:CN202311714139.8

    申请日:2023-12-13

    Abstract: 本说明书公开了一种模型训练、代码生成方法、装置、存储介质及设备。所述模型训练方法包括:获取样本序列,将各样本序列输入到预设的代码生成模型中,以通过代码生成模型,针对样本序列中变量序列包含的变量对应的语义单元,根据在样本代码中在作为该语义单元之前的各语义单元中,确定出除与作为该语义单元的变量之间不存在依赖关系的其他变量对应的语义单元之外的其他语义单元各该语义单元之间的相关度,确定该语义单元的注意力特征表示,并以最小化基于该语义单元的注意力特征得到的预测语义单元和预测语义单元在样本代码中实际对应的语义单元之间的偏差为优化目标,对代码生成模型进行训练,得到训练后代码生成模型。

    面向芯粒的深度大模型容错部署优化方法和系统

    公开(公告)号:CN117632148A

    公开(公告)日:2024-03-01

    申请号:CN202311611108.X

    申请日:2023-11-29

    Abstract: 本发明公开了一种面向芯粒的深度大模型容错部署优化方法和系统,该方法包括以下步骤:获取深度大模型的计算图、算子的划分策略及故障芯粒不规则拓扑结构;通过优化算子的划分策略和硬件资源数量分配策略,最小化计算图的计算开销、通信开销和随机映射的链路争用开销,得到算子的最佳划分策略和最佳资源分配数量;通过优化算子基于芯粒不规则拓扑结构的硬件映射策略,最小化芯粒故障网络的链路争用开销,得到算子的最佳映射方案;将上述开销视为总执行开销,通过迭代优化最小化总执行开销,最终获得最佳调度方案。本发明方法能够得到推理性能更强大且执行开销更小的调度方案,推动深度学习大模型在芯粒上的容错部署和优化技术的发展和应用。

    一种多阶段遥感图像目标检测方法、装置、设备和介质

    公开(公告)号:CN116935155A

    公开(公告)日:2023-10-24

    申请号:CN202310766856.9

    申请日:2023-06-27

    Abstract: 本申请涉及一种多阶段遥感图像目标检测方法、装置、计算机设备和计算机可读存储介质,其中,多阶段遥感图像目标检测方法包括:将遥感图像输入至预先训练的第一目标检测网络,输出多个预测框及对应的预测信息;在所述预测框对应的置信度大于第二阈值的情况下,获得第一目标检测结果;在所述预测框对应的置信度介于第一阈值和所述第二阈值之间的情况下,根据所述预测框的位置信息对所述遥感图像进行剪切、旋转、缩放处理后输入至预先训练的第二目标检测网络,获得第二目标检测结果;基于所述第一目标检测结果和所述第二目标检测结果,得到最终目标检测结果。解决了遥感图像目标检测结果精度低的问题,提高了遥感图像目标检测结果的准确性。

    片间数据传输系统及片间数据传输方法

    公开(公告)号:CN116804977A

    公开(公告)日:2023-09-26

    申请号:CN202310657156.6

    申请日:2023-06-05

    Abstract: 本申请涉及一种片间数据传输系统及片间数据传输方法,该系统包括路由模块、流量控制电路和片间通道模块,所述路由模块包括发送路由和接收路由,所述流量控制电路分别与所述发送路由、所述接收路由连接,所述片间通道模块与所述流量控制电路连接;所述片间通道模块用于接收所述发送路由发送的数据段并转发至片外,以及接收所述片外的数据段并转发至所述接收路由;所述流量控制电路用于缓存所述数据段,并根据信用阈值控制所述接收路由接收的数据段的数量,保证了缓存空间的剩余可缓存数据段的数量及时被上游发送方所知,解决了相关技术中存在的流量控制机制对数据传输的控制不精确,导致丢失数据分组的问题。

Patent Agency Ranking