一种面向K3s服务迁移的IP一致性方法

    公开(公告)号:CN119652895A

    公开(公告)日:2025-03-18

    申请号:CN202411769758.1

    申请日:2024-12-04

    Abstract: 一种面向K3s服务迁移的IP一致性方法,属于基于K3s的边缘计算技术领域。为解决现有实现服务迁移对客户端的透明性技术带来的性能和故障容忍方面的问题,本发明进行服务状态迁移时,源节点服务状态迁移模块将请求信息同步给目标节点服务状态迁移模块,对网络配置进行修改;源节点IP迁移模块获取源服务Pod的IP信息写入IP缓存文件,NFS将IP缓存文件同步至目标节点IP迁移模块;目标节点网络插件调用目标节点IP迁移模块读取IP缓存文件,目标节点网络插件将读取的IP分配给目标服务Pod;目标节点服务状态迁移模块使用检查点文件对目标服务Pod进行状态恢复,目标节点网络状态迁移模块对目标节点的网络配置进行修改。

    一种稀疏矩阵乘法的NPU加速方法

    公开(公告)号:CN118171710A

    公开(公告)日:2024-06-11

    申请号:CN202410408275.2

    申请日:2024-04-07

    Abstract: 本发明提出一种稀疏矩阵乘法的NPU加速方法,属于稀疏矩阵乘法加速技术领域。本发明基于CPU+NPU的异构计算机系统架构,提出稀疏矩阵“块”压缩格式CSB和基于CSB的矩阵乘法方法。CSB可将稀疏矩阵进行列排序将非零数据集中存放,基于CSB的矩阵乘法仅对稀疏矩阵非零数据块进行运算,再通过列重排获得结果。本发明可以充分利用NPU内部矩阵单元的算力,解决经典稀疏矩阵存储格式及乘法加速方法不适合NPU处理器的问题。本发明有效提高基于NPU的智能异构计算系统稀疏矩阵乘法计算速度,以及对基于NPU的卷积神经网络模型推理计算效率起到积极作用。

    一种稀疏矩阵乘法的NPU加速方法

    公开(公告)号:CN118171710B

    公开(公告)日:2024-08-23

    申请号:CN202410408275.2

    申请日:2024-04-07

    Abstract: 本发明提出一种稀疏矩阵乘法的NPU加速方法,属于稀疏矩阵乘法加速技术领域。本发明基于CPU+NPU的异构计算机系统架构,提出稀疏矩阵“块”压缩格式CSB和基于CSB的矩阵乘法方法。CSB可将稀疏矩阵进行列排序将非零数据集中存放,基于CSB的矩阵乘法仅对稀疏矩阵非零数据块进行运算,再通过列重排获得结果。本发明可以充分利用NPU内部矩阵单元的算力,解决经典稀疏矩阵存储格式及乘法加速方法不适合NPU处理器的问题。本发明有效提高基于NPU的智能异构计算系统稀疏矩阵乘法计算速度,以及对基于NPU的卷积神经网络模型推理计算效率起到积极作用。

    一种NPU分时复用的实时推理系统和调度方法

    公开(公告)号:CN119668811A

    公开(公告)日:2025-03-21

    申请号:CN202411809599.3

    申请日:2024-12-10

    Abstract: 本发明公开了一种NPU分时复用的实时推理系统和调度方法,属于边缘智能计算技术领域,解决了现有技术中传统的边缘智能计算服务设备和推理调度方法难以保证多推理任务推理实时性的问题;本发明在预处理阶段通过准备态预分割器对智能推理模型进行转换,即:结合单位粒度将智能推理模型划分为不同粒度的分块,并获取模型及其分块的运行属性信息;在执行阶段通过运行时规划器接收远程过程调用的任务请求,再通过非线性优化确定最优调度粒度,并根据低切分的NPU实时调度算法生成相应任务调度序列,通过运行时执行器根据作业序列获取任务需要的模型分块并进行执行。本发明有效提高了多任务场景下边缘智能推理计算任务分时复用NPU资源的实时性。

Patent Agency Ranking