片上网络温度预测方法及装置、设备、存储介质

    公开(公告)号:CN111026603A

    公开(公告)日:2020-04-17

    申请号:CN201911026334.5

    申请日:2019-10-25

    Applicant: 南京大学

    Abstract: 公开了一种片上网络温度预测方法、装置、设备和存储介质。本申请一实施例中,片上网络温度预测方法可以包括:获取片上网络中各个处理器在当前时刻之后预定时长内待处理指令的指令信息;根据所述待处理指令的指令信息,计算片上网络在当前时刻之后预定时长内的功耗;根据片上网络在当前时刻之后预定时长内的功耗、片上网络当前时刻的温度,计算片上网络在预定时刻的温度,所述预定时刻是当前时刻之后的时刻且与当前时刻相差所述预定时长。本申请能够避免因负载波动大而导致的片上网络温度预测准确度降低的问题。

    基于可重构计算的卷积神经网络池化层、硬件实现方法及系统

    公开(公告)号:CN110942145A

    公开(公告)日:2020-03-31

    申请号:CN201911014329.2

    申请日:2019-10-23

    Applicant: 南京大学

    Abstract: 本发明涉及基于一种可重构计算的卷积神经网络池化层、硬件实现方法及系统,该系统包括:控制单元、数据暂存单元、最大池化/平均池化计算单元。控制单元用于读取配置信息,通过有限状态机控制卷积神经网络池化层的运算流程,通过调用最大池化/平均池化计算单元以实现最大池化和平均池化算法;数据暂存单元用于存储计算所需的输入层信息及输出层结果;最大池化/平均池化计算单元用于计算输出层中各个通道的信息。本发明提出了一种可重构的卷积神经网络池化层硬件架构,计算资源和存储资源都可以进行裁剪拆分,在保证算法精度的情况下,高并行度的最大池化/平均池化计算单元大大提高了算法的硬件实现速度,该架构可适用于各种人工智能场景。

    一种多功能线性卷积加速器
    23.
    发明公开

    公开(公告)号:CN119474626A

    公开(公告)日:2025-02-18

    申请号:CN202411565457.7

    申请日:2024-11-05

    Applicant: 南京大学

    Abstract: 本发明属于DSP信号滤波领域,尤其涉及一种多功能线性卷积加速器及方法,包括:所述配置子模块通过总线接收启动信号和配置信号,所述第一状态机子模块在查询并解析所述配置子模块配置的启动信号和第一配置信号后,通过第二状态机子模块启动并配置端口模块,待控制模块接收到端口模快的运算启动信号后,通过第三状态机子模块和第四状态机子模块对应启动并配置访存模块和运算模块,待所述控制模块接收到端口模块和访存模块的结束信号后,向所述端口模块、缓存模块、访存模块和运算模块发送复位信号,同时向状态子模块写入结束状态,等待下一次启动;本发明通过复用访存逻辑和运算逻辑,实现对数字信号处理算法的高性能硬件加速。

    一种二维访存控制器的动态重构方法

    公开(公告)号:CN119441131A

    公开(公告)日:2025-02-14

    申请号:CN202411555388.1

    申请日:2024-11-04

    Applicant: 南京大学

    Abstract: 本发明公开了一种二维访存控制器的动态重构方法,属于访存控制器技术领域,其具体包括:提取矩阵算法的并行度及运算特征,据此确定存储模块的分区方式并分区存储矩阵源数据;基于并行度确定源数据通道的启用数量,实现数据从存储到计算的高效传输;根据并行度和运算特征,通过源数据通道将矩阵源数据从存储模块搬至计算模块,执行矩阵运算;运算结束后,根据并行度和结果确定结果数据通道的启用数量,将结果传回存储模块;根据算法和运算需求动态调整各模块配置,提高了矩阵运算的灵活性和效率。

    一种基于线性分段的softmax硬件实现方法

    公开(公告)号:CN113377332B

    公开(公告)日:2023-08-22

    申请号:CN202110591328.5

    申请日:2021-05-28

    Applicant: 南京大学

    Abstract: 本发明提出了一种基于线性分段的softmax硬件实现方法,该方法实现的电路系统包括:控制器用于实现softmax运算所需的源数据的读取和分发,以及运算结果的存储;排序模块用于将输入进行排序,并找出最大值;自然指数模块用于计算输入源数据的e指数函数值;加法树模块用于将e指数模块的结果进行累加;除法模块用于计算每个e指数计算结果与累加结果的比值。该方法实现的电路系统通过分解计算过程、压缩计算区间,大幅降低了传统查找表方法实现softmax的参数,兼具了高性能和低硬件资源开销,可用于各种人工智能算法加速场景。

    一种基于2型双曲CORDIC任意指数函数的计算系统

    公开(公告)号:CN109739470B

    公开(公告)日:2023-06-13

    申请号:CN201811653497.1

    申请日:2018-12-30

    Applicant: 南京大学

    Abstract: 本发明涉及基于2型双曲CORDIC任意指数函数的计算系统,包括:核心算法控制模块,通过任务调度以及连接其他模块使得整个设计方案依序执行;2型双曲旋转模式CORDIC模块,通过多次迭代计算出以2为底、任意指数的指数函数结果;2型双曲向量模式CORDIC模块,通过多次迭代计算出以2为底、任意真数的对数函数结果;基本运算模块,包括浮点转换单元、延时单元、加法单元和乘法单元,根据输入的浮点型底数、定点型指数,利用这四个单元以及上述两个模块计算并输出类浮点型结果。有益效果:本发明支持任意浮点型底数、任意定点型指数进行指数函数运算,解决了传统固定硬件电路无法实现更广范围内的指数函数运算的问题。

    一种基于超前预测实现相位噪声补偿的硬件系统及其实现方法

    公开(公告)号:CN112260980B

    公开(公告)日:2021-10-26

    申请号:CN202011163735.8

    申请日:2020-10-27

    Applicant: 南京大学

    Abstract: 本发明提出一种基于超前预测实现相位噪声补偿的硬件系统及其实现方法,包括用于控制所有计算模块和存储模块的核心控制模块;用于存储计算出的导频相位角和调制后信号的初始相位角结果数据的存取模块;用于计算定点复数信号的相位角结果的计算模块;以及运用导频点的相位角信息进行均值计算,并对调制后信号的初始相位角结果进行超前相位噪声补偿的超前预测相位噪声补偿模块。本发明在硬件上采用超前预测相位噪声的方式对调制信号的相位进行相位补偿,确保通信硬件实现中的性能和精度要求,降低硬件资源消耗,降低硬件的功耗,全流水地执行硬件计算,能够符合通信系统中的传输特征,适合各个场景下的通信系统中硬件实现相位噪声补偿过程。

    片上网络温度预测方法及装置、设备、存储介质

    公开(公告)号:CN111026603B

    公开(公告)日:2021-04-23

    申请号:CN201911026334.5

    申请日:2019-10-25

    Applicant: 南京大学

    Abstract: 公开了一种片上网络温度预测方法、装置、设备和存储介质。本申请一实施例中,片上网络温度预测方法可以包括:获取片上网络中各个处理器在当前时刻之后预定时长内待处理指令的指令信息;根据所述待处理指令的指令信息,计算片上网络在当前时刻之后预定时长内的功耗;根据片上网络在当前时刻之后预定时长内的功耗、片上网络当前时刻的温度,计算片上网络在预定时刻的温度,所述预定时刻是当前时刻之后的时刻且与当前时刻相差所述预定时长。本申请能够避免因负载波动大而导致的片上网络温度预测准确度降低的问题。

    一种应用于CNN网络卷积层的高效存算系统及其运算方法

    公开(公告)号:CN112052941A

    公开(公告)日:2020-12-08

    申请号:CN202010947798.6

    申请日:2020-09-10

    Applicant: 南京大学

    Abstract: 本发明提出了一种应用于CNN网络卷积层的高效存算系统及其运算方法,该架构包括:用于缓存结果数据的数据缓存模块;用于进行高并行全流水卷积运算,得到卷积运算结果的运算阵列;用于读取数据缓存中的图像源数据并发送给所述运算阵列的源数据分发模块;用于读取数据缓存中的权重数据,并将数据复制重新编组,发送给所述运算阵列的权重共享模块;用于将运算阵列卷积计算结果存入所述数据缓存模块中的结果数据写入模块。本发明提出的高效存算架构基于全流水的并行运算簇设计了运算阵列,并且设计与之匹配的数据缓存和高带宽供数通道,以较低的硬件复杂度,实现了CNN网络密集卷积算法的高性能运算,具有良好的应用前景。

    一种多通道无冲突拆分的硬件实现方法及运行该方法的计算机设备与可读存储介质

    公开(公告)号:CN111045965A

    公开(公告)日:2020-04-21

    申请号:CN201911025671.2

    申请日:2019-10-25

    Applicant: 南京大学

    Abstract: 本发明涉及一种多通道无冲突拆分的硬件实现方法及运行该方法的计算机设备与可读存储介质,该方法基于DMA接口单元、控制单元、数据存储单元、无冲突访存单元和数据重组单元实现。DMA接口单元用于DDR和SRAM之间的数据交互;控制单元用于根据配置信息选择数据存储单元划分模式和无冲突访存单元访存模式;数据存储单元用于存储源数据和结果数据;无冲突访存单元通过地址映射将按采样点输入的源数据按通道存入数据存储单元;数据重组单元用于根据配置信息重组结果数据,送至DMA接口单元进行结果输出。本发明对采样点数、通道数没有限制,适用于数字信号处理和人工智能场景,具有高通用性、高并行路数、高存储资源利用率和低控制复杂度的特点。

Patent Agency Ranking