-
公开(公告)号:CN115115018B
公开(公告)日:2025-04-01
申请号:CN202110295873.X
申请日:2021-03-19
Applicant: 南京大学
IPC: G06N3/082 , G06N3/063 , G06N3/049 , G06N3/0442
Abstract: 本申请提供一种用于长短记忆神经网络的加速系统,所述加速系统包括主机以及与所述主机实现数据交互的加速装置。所述加速装置包括:含有多个计算通道的通道组,与所述通道组相连接的权重缓存区、偏置缓存区以及激活缓存区,除此之外,加速装置还包括控制器以及解码组件。本申请中,主机用于对权重数据进行预处理获得第一输入数据,该第一输入数据为多组参数数量均衡的权重数据的集合。权重缓存区用于接收第一输入数据,该第一输入数据经解码组件解码后即可用于计算。将多组参数数量均衡的权重数据分别分配给不同处理单元进行计算,使得不同处理单元处理时间基本一致,从而解决随机稀疏带来的硬件负载不均衡问题。
-
公开(公告)号:CN118312133A
公开(公告)日:2024-07-09
申请号:CN202410394029.6
申请日:2024-04-02
Applicant: 南京大学
IPC: G06F7/523
Abstract: 本申请提供一种基于Karatsuba的超高阶二进制多项式乘法器,包括:逐列计算模块、重排序模块、OKA乘法器模块。逐列计算模块用于将输入的有限域中的超高阶二进制多项式划分为块,块为n‑项多项式;重排序模块用于通过二叉树模型的深度优先递归函数,对块中划分后的各项进行排序;OKA乘法器模块通过递归对排序后的块中各项进行运算。本申请结合逐列计算策略,按块计算列,减小面积,高效地实现了超高阶二进制多项式乘法;通过重排序模块,对输入多项式的各项进行排序,降低了算法的复杂度;递归的OKA乘法器位宽具有可伸缩性,改变乘法器的转换级别,可以平衡延时和面积,进而取得更好的面效比。
-
公开(公告)号:CN112685003B
公开(公告)日:2024-05-28
申请号:CN202110006918.7
申请日:2021-01-05
Applicant: 南京大学
Abstract: 本申请公开了一种用于获取同源密码的模乘结果的运算装置,包括数据获取单元、数据处理单元、乘加单元、约简单元以及后处理单元,数据获取单元被配置为获取待处理的有限数域Fa和Fb,乘加单元被配置为对所述有限数域Fa和Fb执行乘加计算,得到乘加计算结果Fc,约简单元被配置为对所述乘加计算结果Fc执行约简计算,得到约简结果,后处理单元被配置为对所述约简结果执行后处理操作,得到模乘结果。通过并行计算约简结果,提升运算速度,降低运算延时,解决现有运算装置延时高、运算速度过慢的问题。
-
公开(公告)号:CN112286490B
公开(公告)日:2024-04-02
申请号:CN202011254262.2
申请日:2020-11-11
Applicant: 南京大学
Abstract: 本申请示出一种循环迭代乘加运算的硬件架构及方法,用于公式#imgabs0#的计算,包括:接收单元、选择单元、乘法器、加法器以及存储单元;乘法器计算an‑1和R的乘法结果输出至加法器,加法器计算乘法结果与第二选择器的筛选结果得到加法结果并将其分为高位和低位,输出至选择器进行下一轮循环迭代乘加运算,共进行n(n‑1)个时钟周期完成整个运算。本申请示出的一种循环迭代乘加运算的硬件架构及方法,计算复杂度低、资源消耗低、占用面积小,在需要计算该公式且对面积以及时钟频率有要求的特定场合能起到重要作用。
-
公开(公告)号:CN117742663A
公开(公告)日:2024-03-22
申请号:CN202311645720.9
申请日:2023-12-04
Applicant: 南京大学
Abstract: 本申请提供一种基于变换基的快速模乘系统,快速模乘系统包括用于将输入的第一模乘输入A和第二模乘输入B进行变换基处理的预计算层;用于对已经完成变换基处理的第一模乘输入A和第二模乘输入B依次进行分组乘法处理和重组归约处理的多项式模乘层;用于对已经完成重组归约处理包含第一模乘输入A和第二模乘输入B的多项式依次进行若干次映射布线处理和累加处理的迭代约简层;用于将已经完成最后一次累加处理的包含第一模乘输入A和第二模乘输入B的多项式由X进制转变为二进制的进制还原层。本申请通过上述快速模乘系统减少了电路硬件的使用,节约了电路的面积,并且和传统的模乘系统相比面积和速度上都更具优势。
-
公开(公告)号:CN117521718A
公开(公告)日:2024-02-06
申请号:CN202311462440.4
申请日:2023-11-06
Applicant: 南京大学
Abstract: 本发明提供了用于高能效自注意力机制计算的误差自适应的近似乘法器,本发明提出了一种根据数值大小自适应调整计算误差的近似乘法器,首先设计了一种计算误差为负的近似部分积生成器和一种计算误差为正的近似4:2压缩器,二者的误差会相互补偿,可以有效降低总体误差,从而可以容忍更多的近似比特,获得面积更小、功耗更低的近似乘法器电路;其次在华莱士树的第一级压缩器阵列的近似压缩器中加入power_gating控制电路,实现计算误差可以根据计算数值自适应调整,本发明可以实现更加激进、也更加低功耗的乘法器电路设计。
-
公开(公告)号:CN117149131A
公开(公告)日:2023-12-01
申请号:CN202311247914.3
申请日:2023-09-26
Applicant: 南京大学
IPC: G06F7/498
Abstract: 本发明提供了一种快速右移移位累加器、分布式算法处理器和滤波器,所述累加器包括加法模块和用来打断进位链的进位寄存器,所述加法模块包含n个全加器和n个寄存器,每个全加器的和输出端都连接一个寄存器;加法模块有三个输入和两个输出,第一个输入来自于高一级加法模块的n位和输出,第二个输入来自于接收的n位数据,第三个输入是进位寄存器的输出。本发明首次从根本上解决中右移移位累加器频率瓶颈问题的方案。本方案通过较小的额外硬件消耗,可将通过传统优化方案无法继续优化的右移移位累加器频率做进一步提升。
-
公开(公告)号:CN117011068A
公开(公告)日:2023-11-07
申请号:CN202310971757.4
申请日:2023-08-03
Applicant: 南京大学
Abstract: 本发明提供了一种基于文本分析的可解释的金融数据可视化分析方法,包括:步骤1,采集股价文本数据并进行预处理,然后标注拐点;步骤2,对股价文本数据进行预测;步骤3,采用可视化方法输出预测结果。本方法提供了两种拐点定义,除了一种被广泛使用的定义,本方法还提出了一种新的拐点定义以捕捉短期价格波动。除此之外,可视化的界面也直观的展示了本发明方法的逻辑,大大增强了可解释性。本方法简单有效且易于推广,本方法中的各个模块可以被更换或优化,以满足不同的场景需求。
-
-
公开(公告)号:CN116933840A
公开(公告)日:2023-10-24
申请号:CN202310971673.0
申请日:2023-08-03
Applicant: 南京大学
IPC: G06N3/0455 , G06F7/52
Abstract: 本发明提供了支持可变指数位宽的多精度Posit编解码运算装置及方法,所述装置包括多精度Posit译码器、多精度Posit运算单元和多精度Posit编码器;多精度Posit译码器接收Posit输入数据、精度模式控制信号和指数位宽es配置信号,完成译码操作,得到有效的符号、指数及尾数值输出;多精度Posit运算单元完成相应的运算并将运算结果发送给多精度Posit编码器,多精度Posit编码器完成Posit输出数据的编码。本发明实现了运行时指数位宽动态可配置,能在相同的硬件中同时支持Posit格式大动态范围和高数值精度的优势,同时实现了硬件高效的多精度Posit编解码运算。
-
-
-
-
-
-
-
-
-