一种基于反向流水线的异构训练加速器

    公开(公告)号:CN114742216A

    公开(公告)日:2022-07-12

    申请号:CN202210412651.6

    申请日:2022-04-19

    Applicant: 南京大学

    Abstract: 本申请公开了一种基于反向流水线的异构训练加速器,该加速器包括数据模块、控制模块和计算模块;控制模块控制BP阶段前向反向计算核执行第一通道的卷积运算,并控制所述归一池化计算核对卷积运算结果进行处理,得到当前卷积层的第一通道的第一输出误差,并将第一输出误差传入WG计算核,同时控制WG计算核根据第一输出误差以及前一卷积层的第一通道的输入值,执行深度神经网络的WG阶段所对应的卷积运算。该加速器BP和WG过程的流水线并行处理,降低了系统延时、避免了数据在不同层级存储的额外传输,降低了功耗,同时其异构架构设计可以实现对不同类型的计算单独优化,提高能耗比和加速比。

    一种用于端侧实时训练的加速器
    2.
    发明公开

    公开(公告)号:CN114861899A

    公开(公告)日:2022-08-05

    申请号:CN202210408991.1

    申请日:2022-04-19

    Applicant: 南京大学

    Abstract: 本申请公开了一种用于端侧实时训练的加速器。所述加速器包括数据模块、地址解码模块、计算模块和控制模块,所述数据模块包括特征存储块、权重非零值存储块和权重比特图存储块,所述特征存储块包括多个存储单元,所述存储单元用于存储各个阶段对应的输入组中的各个输入块,所述输入块为待与对应权重值进行相乘的数据矩阵,所述权重值按照从前到后的顺序依次检测第一位置所有维度的值,所述权重非零值存储块和所述权重比特图存储块用于存储稀疏后的权重数据,所述控制模块用于控制各个阶段的执行过程。本申请提供的加速器能够改善负载不均衡问题,提高网络检测速度。

    应用于智能终端的图像分类方法及装置

    公开(公告)号:CN115205593A

    公开(公告)日:2022-10-18

    申请号:CN202210836215.1

    申请日:2022-07-15

    Applicant: 南京大学

    Abstract: 本申请提供一种应用于智能终端的图像分类方法及装置。所述方法包括:响应于图像分类任务,从候选模型集合中随机选取一个候选模型,得到目标模型;使用目标模型执行图像分类任务,得到分类结果。其中,候选模型集合包括通过云端GPU按照不同的稀疏阈值,结构化稀疏一个原始模型得到的多个候选模型。采用本申请提供的所述图像分类方法,即使攻击者获得用于推理的所有信息,包括模型结构、参数、随机策略以及用于随机的候选模型集合,但是也不能得知我们当前用于推理的候选模型集合中的哪一个模型。因此,不管攻击者采用同样的随机策略或者利用固定模型生成攻击样本,本申请提供的图像分类方法都能够兼顾用于推理的神经网络模型的鲁棒性和高效性。

Patent Agency Ranking