-
公开(公告)号:CN108804073B
公开(公告)日:2021-12-17
申请号:CN201810497800.7
申请日:2018-05-21
Applicant: 南京大学
Abstract: 本发明涉及一种多流水实时高速排序引擎的硬件实现方法,包括:基本排序单元,使用冒泡排序算法,通过流水线实现实时排序;数据选择单元,计算出用于选择需要输出的数据的地址选择信号addr;数据输出单元,根据地址选择信号addr输出数据,数据输出单元设有两路输出分别为:串行输出和类存储器输出,串行输出输出最小的数,类存储器输出排序好的序列。有益效果:本发明的方法可针对不同的应用场景,有串行和类存储器两种输出,类存储器输出方式既可以直接查找所有数据,又可以节约IO资源;在数据选择单元的设计中使用多米诺逻辑技术实现数据复用,有效提升了资源利用率。
-
公开(公告)号:CN108804073A
公开(公告)日:2018-11-13
申请号:CN201810497800.7
申请日:2018-05-21
Applicant: 南京大学
CPC classification number: G06F7/02 , G06F9/30021
Abstract: 本发明涉及一种多流水实时高速排序引擎的硬件实现方法,包括:基本排序单元,使用冒泡排序算法,通过流水线实现实时排序;数据选择单元,计算出用于选择需要输出的数据的地址选择信号addr;数据输出单元,根据地址选择信号addr输出数据,数据输出单元设有两路输出分别为:串行输出和类存储器输出,串行输出输出最小的数,类存储器输出排序好的序列。有益效果:本发明的方法可针对不同的应用场景,有串行和类存储器两种输出,类存储器输出方式既可以直接查找所有数据,又可以节约IO资源;在数据选择单元的设计中使用多米诺逻辑技术实现数据复用,有效提升了资源利用率。
-
公开(公告)号:CN108710943B
公开(公告)日:2021-11-16
申请号:CN201810488050.7
申请日:2018-05-21
Applicant: 南京大学
IPC: G06N3/063
Abstract: 本发明的多层前馈神经网络并行加速器,包括:主控制模块,控制整个计算流程;系数地址生成模块,生成系数的地址,将所述系数的地址输出;并接收存储控制模块的系数数据,将系数数据拆分后输出;操作数地址生成模块,生成操作数的存储地址并输出;接收存储控制模块的操作数数据,将数据拆分后并输出;前馈网络计算模块,接收拆分后的系数数据与操作数数据,包含若干路并行计算的计算单元;神经元地址生成模块,接收前馈网络计算模块计算得到的神经元数据,生成神经元的存储地址和神经元数据,并将所述神经元的存储地址和神经元数据输出。有益效果:可扩展性好,并行度可调,加速比高;支持流水操作,资源消耗少。
-
公开(公告)号:CN108710943A
公开(公告)日:2018-10-26
申请号:CN201810488050.7
申请日:2018-05-21
Applicant: 南京大学
IPC: G06N3/063
CPC classification number: G06N3/063
Abstract: 本发明的多层前馈神经网络并行加速器,包括:主控制模块,控制整个计算流程;系数地址生成模块,生成系数的地址,将所述系数的地址输出;并接收存储控制模块的系数数据,将系数数据拆分后输出;操作数地址生成模块,生成操作数的存储地址并输出;接收存储控制模块的操作数数据,将数据拆分后并输出;前馈网络计算模块,接收拆分后的系数数据与操作数数据,包含若干路并行计算的计算单元;神经元地址生成模块,接收前馈网络计算模块计算得到的神经元数据,生成神经元的存储地址和神经元数据,并将所述神经元的存储地址和神经元数据输出。有益效果:可扩展性好,并行度可调,加速比高;支持流水操作,资源消耗少。
-
-
-