一次性网络架构搜索方法及硬件加速器

    公开(公告)号:CN117454932A

    公开(公告)日:2024-01-26

    申请号:CN202311280100.X

    申请日:2023-10-07

    Applicant: 南京大学

    Abstract: 本申请提供一种一次性网络架构搜索方法及硬件加速器,所述方法包括:构建超级网络,超级网络由多个层结构组成,获取一次性超级网络训练算法,基于一次性超级网络训练算法,对超级网络进行训练,得到目标深度神经网络;基于目标深度神经网络,利用遗传算法并结合FPGA加速器,使用FPGA感知的网络架构搜索,得到具有最优精度和硬件性能的网络架构,以解决目前基于乘法算子的深度神经网络在执行图像分类任务时的分类精度虽然高,但是在硬件实现时,能耗和面积开销巨大,很难应用到移动设备或者物联网设备中;而基于无乘法算子的深度神经网络虽然在硬件实现时,具有优越的硬件执行效率,但其在完成图像分类任务时,分类精度较低的问题。

    深度神经网络的架构搜索方法及硬件加速器

    公开(公告)号:CN115238879A

    公开(公告)日:2022-10-25

    申请号:CN202210980058.1

    申请日:2022-08-16

    Applicant: 南京大学

    Inventor: 王中风 石卉虹

    Abstract: 本申请提供一种深度神经网络的架构搜索方法及硬件加速器。所述架构搜索方法包括:构建超级网络,所述超级网络包括依次连接的第一固定层、候选模块模组、第二固定层、池化层以及分类器;候选模块的搜索空间包括卷积层和非卷积层,非卷积层为加法层和/或移位层;预训练超级网络,以更新超级网络的权重参数;使用可微分搜索算法从所述预训练后的超级网络中搜索,得到目标深度神经网络。所述候选模块组的搜索空间包括卷积层和加法层和/或移位层,如此,得到的目标深度神经网络是一种乘法减少的混合深度神经网络,具有基于乘法算子的卷积层精度高的优点、以及加法层或者移位层的硬件效率高的优点,实现硬件效率和任务精度的平衡。

    一种基于Transformer的加速系统及方法

    公开(公告)号:CN118133908A

    公开(公告)日:2024-06-04

    申请号:CN202410133248.9

    申请日:2024-01-31

    Applicant: 南京大学

    Abstract: 本申请提供一种基于Transformer的加速系统及方法,所述系统包括硬件加速器和神经网络模块,神经网络模块中运行有神经网络模型,硬件加速器包括存储器、第一加速模块和第二加速模块,第一加速模块包括多个可重构单元,第二加速模块包括多个处理单元,第一加速模块通过可重构单元对键值对数据累加计算,得到注意力数据,第二加速模块通过处理单元,根据权重数据和特征图数据计算多层感知机数据,神经网络模块根据注意力数据和多层感知机数据输出分类结果。本申请通过加速模块对神经网络模型中的计算流程进行加速,实现对神经网络模型的整体加速,提高神经网络模型处理数据的效率。

    一种快速风格迁移卷积神经网络
    4.
    发明公开

    公开(公告)号:CN115759193A

    公开(公告)日:2023-03-07

    申请号:CN202111550985.1

    申请日:2021-12-17

    Applicant: 南京大学

    Abstract: 本申请提供了一种快速风格迁移卷积神经网络,包括:编码层、下采样层、残差块、上采样层和解码层;所述编码层包括实例归一化层;所述上采样层包括插值层和卷积层;所述卷积层为深度可分离卷积层;所述编码层和所述解码层中使用的卷积核尺寸为7*7或5*5,所述残差块中使用的卷积核尺寸为3*3;所述残差块中的第一个逐点操作层后接非线性激活函数;所述下采样层中采用步长大于1的卷积或者使用池化层。在视觉质量几乎不损失的前提下,该轻量级网络可以实现67倍以上的模型体积压缩和63倍的浮点计算的减少。

    一种面向复杂纹理结构的艺术字生成系统

    公开(公告)号:CN114943783A

    公开(公告)日:2022-08-26

    申请号:CN202210651537.9

    申请日:2022-06-09

    Applicant: 南京大学

    Abstract: 本申请提供一种面向复杂纹理结构的艺术字生成系统,包括输入处理模块处理输入的源文字生成黑白文本掩膜,利用黑白文本掩膜处理输入的风格图片生成风格小块;生成对抗网络模型的第一生成器处理黑白文本掩膜和风格小块,生成扩充预设倍数的真实边缘的风格大块;生成对抗网络模型的第二生成器处理风格大块进行,生成风格大块的黑白风格掩膜;细节细化模块包括结构细化网络和纹理细化网络,结构细化网络结构细化处理风格大块,生成中间艺术字;纹理细化网络根据黑白风格掩膜纹理细化处理中间艺术字,生成最终艺术字。如此,通过生成艺术字雏形,再对艺术字雏形进行结构和细节细化,实现了基于复杂纹理结构生成复杂风格效果的艺术字。

Patent Agency Ranking