-
公开(公告)号:CN111026603B
公开(公告)日:2021-04-23
申请号:CN201911026334.5
申请日:2019-10-25
Applicant: 南京大学
Abstract: 公开了一种片上网络温度预测方法、装置、设备和存储介质。本申请一实施例中,片上网络温度预测方法可以包括:获取片上网络中各个处理器在当前时刻之后预定时长内待处理指令的指令信息;根据所述待处理指令的指令信息,计算片上网络在当前时刻之后预定时长内的功耗;根据片上网络在当前时刻之后预定时长内的功耗、片上网络当前时刻的温度,计算片上网络在预定时刻的温度,所述预定时刻是当前时刻之后的时刻且与当前时刻相差所述预定时长。本申请能够避免因负载波动大而导致的片上网络温度预测准确度降低的问题。
-
公开(公告)号:CN112486455A
公开(公告)日:2021-03-12
申请号:CN202011357034.8
申请日:2020-11-27
Applicant: 南京大学
Abstract: 本发明提出一种基于CORDIC方法求复数的N次开根号的硬件计算系统及其计算方法,该系统包括:控制单元使用状态机的方式控制整个系统的运算流程;平面坐标转化极坐标计算单元,用以将待求复数由平面坐标形式转化为极坐标形式;模长计算单元,用以计算待求复数的极坐标形式中的模长的N次开根号;相角计算单元,用以计算待求复数的极坐标形式中的相角的N分之一;极坐标转化平面坐标计算单元,用以将所求得的复数由极坐标形式转化为平面坐标形式并输出。该系统有效地通过拓展所使用的CORDIC计算单元的收敛域来扩展输入范围,其次可以通过调整正向迭代次数灵活地调节计算精度。在信号处理与无线通信等领域中具有广泛的应用。
-
公开(公告)号:CN112052941A
公开(公告)日:2020-12-08
申请号:CN202010947798.6
申请日:2020-09-10
Applicant: 南京大学
Abstract: 本发明提出了一种应用于CNN网络卷积层的高效存算系统及其运算方法,该架构包括:用于缓存结果数据的数据缓存模块;用于进行高并行全流水卷积运算,得到卷积运算结果的运算阵列;用于读取数据缓存中的图像源数据并发送给所述运算阵列的源数据分发模块;用于读取数据缓存中的权重数据,并将数据复制重新编组,发送给所述运算阵列的权重共享模块;用于将运算阵列卷积计算结果存入所述数据缓存模块中的结果数据写入模块。本发明提出的高效存算架构基于全流水的并行运算簇设计了运算阵列,并且设计与之匹配的数据缓存和高带宽供数通道,以较低的硬件复杂度,实现了CNN网络密集卷积算法的高性能运算,具有良好的应用前景。
-
公开(公告)号:CN111045965A
公开(公告)日:2020-04-21
申请号:CN201911025671.2
申请日:2019-10-25
Applicant: 南京大学
Abstract: 本发明涉及一种多通道无冲突拆分的硬件实现方法及运行该方法的计算机设备与可读存储介质,该方法基于DMA接口单元、控制单元、数据存储单元、无冲突访存单元和数据重组单元实现。DMA接口单元用于DDR和SRAM之间的数据交互;控制单元用于根据配置信息选择数据存储单元划分模式和无冲突访存单元访存模式;数据存储单元用于存储源数据和结果数据;无冲突访存单元通过地址映射将按采样点输入的源数据按通道存入数据存储单元;数据重组单元用于根据配置信息重组结果数据,送至DMA接口单元进行结果输出。本发明对采样点数、通道数没有限制,适用于数字信号处理和人工智能场景,具有高通用性、高并行路数、高存储资源利用率和低控制复杂度的特点。
-
公开(公告)号:CN119376449A
公开(公告)日:2025-01-28
申请号:CN202411490434.4
申请日:2024-10-24
Applicant: 南京大学
IPC: G05D23/19
Abstract: 本发明公开了一种基于片上网络的紧凑型交叉温控方法,涉及多处理器嵌入式开发技术领域,设计交错相位控制策略以增加控制周期内最小网络单元的节点纠正次数,避免同步温控引起的热问题,设计负反馈温控策略以控制节点和邻接节点之间的交互行为,进一步稳定节点的温度,基于控制相位分配算法将片上网络中节点类型的分配类比为图着色问题,设置剪枝约束和选取约束以优化回溯法,快速生成最优类型分配方案,并结合交错相位控制策略和负反馈温控策略实现片上网络的最佳交叉温控,设计性能评估方案,经检验,本发明提出的方法在评估指标上均优于对比方案,有效解决了片上网络的热问题。
-
公开(公告)号:CN113127802B
公开(公告)日:2023-08-08
申请号:CN202110459595.7
申请日:2021-04-27
Applicant: 南京大学
Abstract: 本发明首次提出了一种基于CORDIC算法的复对数实现方法、装置、设备及计算机存储介质,主要利用圆周向量模块(VC‑CORDIC),双曲向量模块(VH‑CORDIC)进行联级操作。首先,将所需计算目标的实部和虚部输入圆周向量模块(VC‑CORDIC)进行迭代计算,VC‑CORDIC模块得出所求结果的虚部以及实部中间值;然后将实部中间值的相邻值作为VH‑CORDIC模块的输入进行迭代计算,得出的结果经过减法和移位操作之后得到所求结果的实部,进一步减少了计算的复杂度,相比于传统的查找表、线性近似的方法,本发明具有精度高、面积小、功耗低的特点。
-
公开(公告)号:CN113127802A
公开(公告)日:2021-07-16
申请号:CN202110459595.7
申请日:2021-04-27
Applicant: 南京大学
Abstract: 本发明首次提出了一种基于CORDIC算法的复对数实现方法、装置、设备及计算机存储介质,主要利用圆周向量模块(VC‑CORDIC),双曲向量模块(VH‑CORDIC)进行联级操作。首先,将所需计算目标的实部和虚部输入圆周向量模块(VC‑CORDIC)进行迭代计算,VC‑CORDIC模块得出所求结果的虚部以及实部中间值;然后将实部中间值的相邻值作为VH‑CORDIC模块的输入进行迭代计算,得出的结果经过减法和移位操作之后得到所求结果的实部,进一步减少了计算的复杂度,相比于传统的查找表、线性近似的方法,本发明具有精度高、面积小、功耗低的特点。
-
公开(公告)号:CN111061150B
公开(公告)日:2020-11-27
申请号:CN201911014333.9
申请日:2019-10-23
Applicant: 南京大学
IPC: G05B13/04
Abstract: 本发明涉及一种拉普拉斯频率响应的硬件实现方法,包括:主控制模块,源数据地址生产模块,结果地址生成模块,计算阵列模块,存储资源模块。所述的主控制模块一方面控制存储单元和运算单元的信号,另一方面实现存储单元和控制单元之间的数据交换;所述的源数据地址生成模块完成读取地址的生成;所述的结果地址生成模块完成写入地址的生成;所述的计算阵列模块由一系列运算单元组成,包括乘法器和加法器;所述的存储资源模块包含一系列存储单元。与传统的方法相比,本发明充分利用硬件的并行性以及数据的重用,加快了求拉普拉斯频率响应的运算速度。
-
公开(公告)号:CN111061150A
公开(公告)日:2020-04-24
申请号:CN201911014333.9
申请日:2019-10-23
Applicant: 南京大学
IPC: G05B13/04
Abstract: 本发明涉及一种拉普拉斯频率响应的硬件实现方法及系统。包括:主控制模块,源数据地址生产模块,结果地址生成模块,计算阵列模块,存储资源模块。所述的主控制模块一方面控制存储单元和运算单元的信号,另一方面实现存储单元和控制单元之间的数据交换;所述的源数据地址生成模块完成读取地址的生成;所述的结果地址生成模块完成写入地址的生成;所述的计算阵列模块由一系列运算单元组成,包括乘法器和加法器;所述的存储资源模块包含一系列存储单元。与传统的方法相比,本发明充分利用硬件的并行性以及数据的重用,加快了求拉普拉斯频率响应的运算速度。
-
公开(公告)号:CN109635937A
公开(公告)日:2019-04-16
申请号:CN201811646420.1
申请日:2018-12-30
Applicant: 南京大学
CPC classification number: G06N3/0454 , G06N3/06
Abstract: 本发明的面向低位宽卷积神经网络的低功耗系统包括:控制器、配置器、计算单元、片上存储单元、片上存储控制单元和总线接口;采用流处理架构,将总任务切分为几个子任务流水处理;发明了任务均衡切割策略,能提高吞吐率,减少每帧图像识别时间;其针对低位宽卷积神经网络算法特点,实现了一种硬件友好的算法优化,可省略批标准化层的处理步骤。该系统因其超低功耗,超小面积、吞吐率高的特点,非常适用于嵌入式、物联网应用领域,能够高效率完成图像识别、人脸识别等功能。
-
-
-
-
-
-
-
-
-