一种可拼接、可分段的全连接神经网络推理加速器及其加速方法

    公开(公告)号:CN111860819B

    公开(公告)日:2023-11-07

    申请号:CN202010731785.5

    申请日:2020-07-27

    Applicant: 南京大学

    Abstract: 本发明涉及一种可拼接、可分段的全连接神经网络推理加速器及其加速方法,加速器包括控制模块、存储模块、计算模块三大功能模块,控制模块有三种模式:配置模式、搬运模式、计算模式。本发明充分利用全连接计算的可并行性以及权重的可共享性,支持多批处理、多路并行计算。控制模块通过模式的跳转来控制整个全连接的实现与加速。本发明可以实现对输入神经元和权重的独立地址的拼接,即可以将需要进行多次计算的全连接合并为一次全连接运算;其次,本发明可以实现全连接计算的拆分,通过暂存中间结果的方式对其进行分段计算,在硬件资源有限的情况下,实现大规模的全连接神经网络的计算。

    基于CART算法的随机森林的决策树推理系统及方法

    公开(公告)号:CN110751192B

    公开(公告)日:2023-07-18

    申请号:CN201910927807.2

    申请日:2019-09-27

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于CART算法的随机森林的决策树推理系统,包括控制模块,输出控制信号;数据存储模块,根据所述控制信号传输包含有多棵决策树数据的源数据并存放计算模块的计算结果;计算模块,根据所述控制信号计算Gini不纯度,获取最优特征。有益效果:有效地提高数据推理的精确度,加快算法运行的速度,有着广泛的应用前景,针对不同的场合有良好的应用价值。

    一种轻量化Twofish加密算法加速器及其加速方法

    公开(公告)号:CN116318639A

    公开(公告)日:2023-06-23

    申请号:CN202211093758.5

    申请日:2022-09-08

    Applicant: 南京大学

    Abstract: 本发明提出了一种轻量化Twofish加密算法加速器及其加速方法,其中的主要的模块包括控制器模块、子密钥生成模块、轮运算模块和输入输出白化模块。本发明提出了实现S盒单元置换功能的高效硬件加速电路,并在每一轮运算中引入线性反馈移位寄存器随机选择S盒中的置换电路,从而提高加密过程的安全性;本发明提出的轮运算模块与扩展子秘钥生成单元这两个核心部分在硬件资源上高度共享,根据控制信号切换功能交替运行,因此资源利用较少,硬件实现规模小轻量化,能够良好地适应在SoC中的模块集成。

    一种支持多模式配置的可重构FFT处理器

    公开(公告)号:CN109977347B

    公开(公告)日:2023-06-13

    申请号:CN201910251542.9

    申请日:2019-03-29

    Applicant: 南京大学

    Abstract: 本发明的支持多模式配置的可重构FFT处理器,包括:片上SRAM存储器,通过数据对外传输模块与片外存储器进行通信;可重构计算阵列,包含有若干基于IEEE‑754标准的单精度浮点加法器、减法器以及浮点乘法器;FFT控制器,控制FFT运算的整个流程;数据对外传输模块,控制处理器与片外存储器之间的数据传输。有益效果:该处理器具有运算精度高,加速效果明显,硬件资源利用率高的优点。

    一种并行广义内积重构控制器

    公开(公告)号:CN108762719B

    公开(公告)日:2023-06-06

    申请号:CN201810497969.2

    申请日:2018-05-21

    Applicant: 南京大学

    Abstract: 本发明的并行广义内积重构控制器,包括:中间结果计算模块,接收源数据并根据源数据计算中间结果向量,生成向量的地址,存入bank;每完成一个的计算生成一个完成信号,并将所述完成信号发送至最终结果计算模块,作为启动信号;最终结果计算模块,读数据进入复数乘累加器进行最终结果计算得到结果矩阵第L个元素,生成向量的地址,存入bank;数据存储地址处理模块,根据乒乓操作选择信号进行数据选择,生成正确的bank地址信号。有益效果:计算时间少且存储资源利用率大,可满足在许多信号检测应用场景中进行非均匀检测时,获取检验统计量的高实时性要求。

    面向于B5G系统的流密码可重构加速器及加速方法

    公开(公告)号:CN115603894A

    公开(公告)日:2023-01-13

    申请号:CN202211189124.X

    申请日:2022-09-28

    Abstract: 本发明提出了一种面向于B5G系统的可重构加速器及加速方法。该硬件设计包括可重构控制器模块,用于生成算法选择信号;还包括可重构线性反馈移位寄存器(LFSR)模块,用于循环生成流密码算法运算所用数据;还包括有限状态机(FSM)模块,通过FSM中循环计算最终得出密文。其中可以满足多种流密码算法共模使用LFSR模块,使用各自的计算反馈单元和不同的抽头选取位置适应不同加速场景,即根据输入的算法选择信号,选择不同的数据链路和计算模块。本发明提出的硬件架构可以在B5G系统下根据多种不同场景需求可以自由选择加密效果更佳的算法,共模的设计可以更好地满足B5G系统的超高速加密需求。

    面向神经网络平台的单周期路由器

    公开(公告)号:CN115550235A

    公开(公告)日:2022-12-30

    申请号:CN202211014355.7

    申请日:2022-08-23

    Applicant: 南京大学

    Abstract: 本发明公开一种面向神经网络平台的单周期路由器,属于片上网络技术领域。本发明基于XY维序路由算法,根据切片可能前往的输出方向为不同端口的输入缓冲区分配异构的虚通道;在路由器中设有虚通道标识更新单元,通过虚通道标识更新提前判断切片在下一跳路由写入的虚通道即下一跳路由的输出方向,并更新其通道标识位,该逻辑时序开销隐藏在切片的线传输延时中。本发明通过对不同向通信流量的异构处理,简化了仲裁单元的数量和结构,降低了仲裁逻辑的时序开销,优化了路由流水线,有效降低片上网络的通信延时,改善网络扩展带来的延时上升情况,实现了单切片快速通行的方案,具有良好的使用价值和广泛的应用前景。

    适用于动态显示芯片的电流调节方法和系统

    公开(公告)号:CN115357091A

    公开(公告)日:2022-11-18

    申请号:CN202211030031.2

    申请日:2022-08-26

    Applicant: 南京大学

    Abstract: 本发明公开了一种适用于动态显示芯片的电流调节方法和系统,该方法主要包括对电流进行时域划分,产生最小时钟电流;基于所述最小时钟电流和设置的控制倍数,获得输出电流。本发明创新性引入了控制倍数的概念,从而实现显示电流的进一步增大、减小,但不对面积产生过多提高,能够有效地拓展电流范围,并根据实际使用效果、场景等,切换不同的位数等级,以达到更好的显示效果。该方法能够在不影响芯片面积的情况下,提高电流的精度和范围。

    一种基于离线强化学习的片上网络近似控制系统

    公开(公告)号:CN115277563A

    公开(公告)日:2022-11-01

    申请号:CN202210636087.6

    申请日:2022-06-07

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于离线强化学习的片上网络近似控制系统。本发明采用离线强化学习算法,利用软硬件协同手段,在软件端训练,在硬件端部署;片上网络中设置全局近似控制器用来部署决策神经网络;其余节点利用局部数据控制器根据全局近似控制器的发送的信息调整数据近似率。本发明通过离线强化学习算法对决策网络进行训练,将训练完成的决策网络部署至硬件中,能在不同的应用条件下感知网络拥塞状态,动态调整数据近似率使得网络在传输质量和网络性能两者之间达到良好平衡。

    一种基于microblaze的实时视频接缝剪裁方法及系统

    公开(公告)号:CN113727161B

    公开(公告)日:2022-07-29

    申请号:CN202111032732.5

    申请日:2021-09-03

    Applicant: 南京大学

    Abstract: 本发明提出了一种基于microblaze的实时视频接缝剪裁方法及系统,可用于采集视频后进行接缝剪裁处理并实时显示。其中所述系统由PL端以及PS端两部分共同实现,结合改进的视频接缝剪裁运算方法处理图像,在针对缩小或放大图像时相比原有的Seam Carving算法,在保留视频信息的同时进一步减小画面失真,让用户获得更好的视觉效果。另一方面,本发明提出的系统资源占用小,可移植性强,兼具软件编程调试方便与硬件计算处理速度快的优点,软硬件协同工作增加处理速度,减小时延,在保留显示视频完整信息的同时可任意更改画面尺寸,能适配各种规格显示设备,适用于各种直播或监控场景。

Patent Agency Ranking