一种用于端侧实时训练的加速器
    21.
    发明公开

    公开(公告)号:CN114861899A

    公开(公告)日:2022-08-05

    申请号:CN202210408991.1

    申请日:2022-04-19

    Applicant: 南京大学

    Abstract: 本申请公开了一种用于端侧实时训练的加速器。所述加速器包括数据模块、地址解码模块、计算模块和控制模块,所述数据模块包括特征存储块、权重非零值存储块和权重比特图存储块,所述特征存储块包括多个存储单元,所述存储单元用于存储各个阶段对应的输入组中的各个输入块,所述输入块为待与对应权重值进行相乘的数据矩阵,所述权重值按照从前到后的顺序依次检测第一位置所有维度的值,所述权重非零值存储块和所述权重比特图存储块用于存储稀疏后的权重数据,所述控制模块用于控制各个阶段的执行过程。本申请提供的加速器能够改善负载不均衡问题,提高网络检测速度。

    基于双向GAN网络的去雾方法及双向GAN网络模型

    公开(公告)号:CN114663291A

    公开(公告)日:2022-06-24

    申请号:CN202011526195.5

    申请日:2020-12-22

    Applicant: 南京大学

    Abstract: 本申请公开了基于双向GAN网络的去雾方法及双向GAN网络模型,该方法包括利用提取得到的待去雾图片中不同像素对应的深度信息,对待去雾图片进行深度处理,然后输入至预先构建的双向GAN网络模型中,获取模型输出的去雾图片。该模型中,清晰图输入端口、第一生成单元及第一判别器依次连接,用于针对清晰图进行特征提取及重建,雾图输入端口、第二生成单元及第二判别器依次连接,用于针对雾图进行特征提取及重建;共享潜在空间中存储有针对清晰图提取的高层特征及针对雾图提取的高层特征。双向GAN网络模型通过成对清晰图及雾图完成训练及验证,包含雾域与清晰域的双向映射关系,能够对不同域下的图片进行处理,有效确保图片重建的真实性。

    一种融合元学习的多终端协同训练算法及系统

    公开(公告)号:CN114330464A

    公开(公告)日:2022-04-12

    申请号:CN202011033398.0

    申请日:2020-09-27

    Applicant: 南京大学

    Abstract: 本申请公开了一种融合元学习的多终端协同训练算法及系统,包括客户端加载位于本地的训练模型并初始化网络的权重参数;客户端利用本地存储的数据样本,采用元学习算法调整所述训练模型,得到调整后模型;服务器对来自多个客户端传输的调整后模型进行融合操作,得到平均模型。本申请提供的方法在联邦学习的基础上,在各个客户端引入针对小样本情境(即少量训练数据)的元学习算法,在训练中可以高效获取少量样本中的元信息,所训练出的模型对于新数据也有较好的迁移性,采用该方法训练出的客户端模型在服务器端进行融合后对于其它客户端的数据集也具有较高的处理精度。

    一种图片识别方法
    24.
    发明公开

    公开(公告)号:CN112712126A

    公开(公告)日:2021-04-27

    申请号:CN202110009127.X

    申请日:2021-01-05

    Applicant: 南京大学

    Abstract: 本申请提供了一种图片识别方法,该方法采用预先训练好的图片识别模型,图片识别模型包括:主网络、分支网络、分支点以及第一处理模块;主网络为任意一种卷积神经网络模型;分支点设置于预定位置处;分支网络包括预设层数并且预设通道宽度的分支网络卷积层;预设层数以及预设通道宽度根据主网络中的下采样层确定;图片识别方法包括:主网络对待识别图片进行第一特征处理,得到第一处理图片;分支网络对第一处理图片进行识别,确定分支识别结果;第一处理模块接收分支网络输出的分支识别结果,并根据分支识别结果与分支识别结果的极大值位置确定交叉熵;如果交叉熵小于预设阈值,则输出分支识别结果。本申请提供的方法提高了图片识别精度。

    一种实现动态计算的高精度高比例的分类模型及分类方法

    公开(公告)号:CN112633402A

    公开(公告)日:2021-04-09

    申请号:CN202011607740.3

    申请日:2020-12-30

    Applicant: 南京大学

    Abstract: 本申请涉及神经网络技术领域,提供一种实现动态计算的高精度高比例的分类模型及分类方法,高精度高比例的分类模型包括主干网络模型和至少一个第一分支网络模型;主干网络模型包括输入端、输出端和多个中间层,在多个中间层的1/4‑1/3的层数之间,插入第一分支网络模型;第一分支网络模型包括分类模块和置信度确定模块。在实际应用过程中,分类模块用于产生插入处的分类输出,置信度确定模块用于判断分类输出是否满足精度要求,若满足精度要求,则高精度高比例的分类模型在第一分支网络模型的输出端提前退出,若不满足精度要求,则放弃分类模块产生的分类输出,并返回主干网络模型的中间层,继续完成分类运算。

    一种基于硬件平台的softmax实现方式

    公开(公告)号:CN108021537A

    公开(公告)日:2018-05-11

    申请号:CN201810016954.X

    申请日:2018-01-05

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于各种硬件平台(CPLD、FPGA、专用芯片等)计算softmax函数的实现方式。softmax函数广泛应用于深度学习的多分类任务及注意力模型等,其中涉及到的e指数及除法计算需要消耗较多的硬件资源。设计方法通过对函数进行数学变换,将其中的e指数计算简化为一次常数乘法、一个输入范围固定的2的指数次运算和一次移位运算;将n次除法运算的简化为一次“最高非零位检测运算”、一次输入范围固定的倒数运算和一次移位运算及n次乘法运算。其中2指数及倒数运算以特殊设计的查找表实现,能以更小的存储空间实现同样精度。将本发明用在深度学习的注意力模型等中,可以在精度几乎不受损的前提下大大提高计算速度,减少计算资源和存储资源的消耗。

    基于三维立体结构的音乐播放系统

    公开(公告)号:CN207097451U

    公开(公告)日:2018-03-13

    申请号:CN201720490832.5

    申请日:2017-05-05

    Applicant: 南京大学

    Abstract: 本实用新型所公开的基于三维立体结构的音乐播放系统,用于交互演奏或乐音播放。该系统包括主机、多个呈三维立体状分布的感应单元、以及连接主机和各感应单元的总线,各感应单元包括电容感应元件及与电容感应元件电连接的子处理器,当电容感应元件电容发生改变时输出感应信号并发送至感应单元中的子处理器,子处理器若判断有触碰或靠近的动作信号时产生乐音触发指令,并将乐音触发指令通过总线传输至主机;主机包括处理器和乐音播放模块,处理器接收到来自各感应单元发出的乐音触发指令后,控制乐音播放模块进行播放相应音乐。通过该系统优化现有近似产品的结构和可靠性,降低制作成本,增强用户体验。(ESM)同样的发明创造已同日申请发明专利

Patent Agency Ranking