-
公开(公告)号:CN119476381A
公开(公告)日:2025-02-18
申请号:CN202411490368.0
申请日:2024-10-24
Applicant: 南京大学
IPC: G06N3/063 , G06N3/084 , G06N3/098 , G06F18/2433
Abstract: 本发明公开了一种基于可学习阈值的异常值感知低精度训练硬件系统,属于神经网络训练领域,旨在解决在边缘计算设备上进行深度神经网络训练时,如何在保证量化精度的同时有效处理异常值的问题。其包括通过在线更新异常值的阈值提高模型量化性能,具体包括以下步骤:配置异常值阈值实时监测和识别输入的计算数据中的异常值,并根据识别结果对计算数据进行感知量化;对感知量化后的计算数据进行数据转换,并进行数据编码,根据数据编码结果确定计算场景;基于计算场景分配计算任务至处理单元簇中;通过梯度下降算法计算异常值梯度,并进行可学习的异常值阈值更新;在网络训练完成后,进行性能评估,并将结果进行整理和输出。
-
公开(公告)号:CN117077746A
公开(公告)日:2023-11-17
申请号:CN202311085861.X
申请日:2023-08-25
Applicant: 南京大学
Abstract: 本发明提供了一种基于二值权重的脉冲神经网络的无监督片上学习系统,包括编码及排序模块,计算模块,求最小值模块,和二值权重更新模块。编码及排序模块将输入数据进行编码并进行升序排列;计算模块计算输出神经元是否产生脉冲,并产生状态向量和索引向量用于神经元选择模块和二值权重更新模块;神经元选择模块选中发射脉冲时间最早的神经元;二值权重更新模块基于二值权重更新规则对选中的神经元的二值权重进行更新。本方法的初始权重,以及在训练及推理时使用的权重均为二值权重(0,1),大大减小了对于硬件中存储的需求,且二值权重无需使用乘法器,能够实现在硬件上进行低面积、低功耗的片上训练。
-
公开(公告)号:CN110751192B
公开(公告)日:2023-07-18
申请号:CN201910927807.2
申请日:2019-09-27
Applicant: 南京大学
IPC: G06F18/2431 , G06N5/01 , G06N5/046
Abstract: 本发明公开了一种基于CART算法的随机森林的决策树推理系统,包括控制模块,输出控制信号;数据存储模块,根据所述控制信号传输包含有多棵决策树数据的源数据并存放计算模块的计算结果;计算模块,根据所述控制信号计算Gini不纯度,获取最优特征。有益效果:有效地提高数据推理的精确度,加快算法运行的速度,有着广泛的应用前景,针对不同的场合有良好的应用价值。
-
公开(公告)号:CN109389212B
公开(公告)日:2022-03-25
申请号:CN201811646433.9
申请日:2018-12-30
Applicant: 南京大学
Abstract: 本发明的面向低位宽卷积神经网络的可重构激活量化池化系统包括:若干个可重构激活量化池化处理单元,用于执行激活、量化、池化操作,并且执行工作模式激活‑量化工作模式或激活‑量化‑池化工作模式的可重构操作;存储单元控制器,用于控制不同配置下可重构激活量化池化单元和存储单元的数据传输;存储单元,用于暂存池化操作中所需的卷积层结果数据。软件优化设计通过将低位宽卷积神经网络的激活、量化等若干步骤简化为一个步骤,可减少冗余计算且不改变原始功能。有益效果:通过将激活、量化、池化三个步骤以可重构的方式映射在同一硬件单元上,减少了硬件资源面积;采用软硬件协同优化的方法,具有面积小、功耗低、灵活性高的特点。
-
公开(公告)号:CN113612575A
公开(公告)日:2021-11-05
申请号:CN202110737035.3
申请日:2021-06-30
Applicant: 南京大学
Abstract: 本发明提出了一种面向Wimax协议的QC‑LDPC译码器译码方法及系统,基于提出的面向Wimax协议的QC‑LDPC译码器,利用存储的QC‑LDPC校验矩阵信息,简化了译码器的译码计算复杂度,同时节省了硬件计算资源。其中,译码过程采用基于Offset Min‑sum的行分层译码算法作为译码方法,使得硬件兼容性更广、且具备易于实现的优点。通过流水化设计,对校验矩阵信息读取、映射,实现了高效流水LDPC译码;最终可支持IEEE 802.16e通信协议下,1/2码率19种码长的LDPC译码运算;因此本发明具有硬件复杂度低,存储资源利用率高的特点,以及可实现高吞吐率LDPC译码运算。
-
公开(公告)号:CN112260980A
公开(公告)日:2021-01-22
申请号:CN202011163735.8
申请日:2020-10-27
Applicant: 南京大学
Abstract: 本发明提出一种基于超前预测实现相位噪声补偿的硬件系统及其实现方法,包括用于控制所有计算模块和存储模块的核心控制模块;用于存储计算出的导频相位角和调制后信号的初始相位角结果数据的存取模块;用于计算定点复数信号的相位角结果的计算模块;以及运用导频点的相位角信息进行均值计算,并对调制后信号的初始相位角结果进行超前相位噪声补偿的超前预测相位噪声补偿模块。本发明在硬件上采用超前预测相位噪声的方式对调制信号的相位进行相位补偿,确保通信硬件实现中的性能和精度要求,降低硬件资源消耗,降低硬件的功耗,全流水地执行硬件计算,能够符合通信系统中的传输特征,适合各个场景下的通信系统中硬件实现相位噪声补偿过程。
-
公开(公告)号:CN111723336A
公开(公告)日:2020-09-29
申请号:CN202010486502.5
申请日:2020-06-01
Applicant: 南京大学
Abstract: 本发明提出了一种采用循环迭代方式的基于cholesky分解的任意阶矩阵求逆硬件加速系统,包括DSP核,外部DDR存储器,AXI接口,主控制器、双DMA控制器、SRAM存储器、PE运算阵列及矩阵求逆运算模块;所述矩阵求逆模块包括cholesky分解,三角矩阵求逆和三角矩阵乘法三个子运算模块,三个子模块使用相同的数据存储方式;采用循环迭代的方法代替传统的乘累加计算,求解cholesky分解的结果以及三角矩阵的逆矩阵,降低了读写数据时的寻址复杂度;采用一种适用于三角矩阵的新型矩阵乘法算法,缩短了矩阵乘法的计算时间;本发明支持4至256阶中任意阶数复数矩阵的求逆运算,具有硬件复杂度低,存储资源利用率高的特点,实现了高阶高性能的设计目标。
-
公开(公告)号:CN119376449A
公开(公告)日:2025-01-28
申请号:CN202411490434.4
申请日:2024-10-24
Applicant: 南京大学
IPC: G05D23/19
Abstract: 本发明公开了一种基于片上网络的紧凑型交叉温控方法,涉及多处理器嵌入式开发技术领域,设计交错相位控制策略以增加控制周期内最小网络单元的节点纠正次数,避免同步温控引起的热问题,设计负反馈温控策略以控制节点和邻接节点之间的交互行为,进一步稳定节点的温度,基于控制相位分配算法将片上网络中节点类型的分配类比为图着色问题,设置剪枝约束和选取约束以优化回溯法,快速生成最优类型分配方案,并结合交错相位控制策略和负反馈温控策略实现片上网络的最佳交叉温控,设计性能评估方案,经检验,本发明提出的方法在评估指标上均优于对比方案,有效解决了片上网络的热问题。
-
公开(公告)号:CN112199317A
公开(公告)日:2021-01-08
申请号:CN202011163715.0
申请日:2020-10-27
Applicant: 南京大学
Abstract: 本发明提出一种RISCV处理器访问Flash存储器的桥接系统及其桥接方法,能够实现RISCV处理器对Flash存储器数据的高速读取。该桥接系统包括:RISCV处理器总线接口,该RISCV处理器采用自定义的ICB总线协议;Flash存储器总线接口,该Flash存储器采用SPI总线协议;ICB控制模块,用来对RISCV处理器发起的总线事务进行处理;SPI总线模块,用来对Flash存储器发起总线事务请求;ICB‑SPI交互模块,用来实现ICB控制模块和SPI控制模块的信号交互。异步电路的设计让RISCV处理器和Flash存储器都能够工作在各自的最高频率下,保证了整个系统的工作效率。与传统的桥接模块相比,本发明不需要异步FIFO完成跨时钟域信号处理,能够减少桥接模块的面积消耗。
-
公开(公告)号:CN109739470A
公开(公告)日:2019-05-10
申请号:CN201811653497.1
申请日:2018-12-30
Applicant: 南京大学
IPC: G06F7/556
Abstract: 本发明涉及基于2型双曲CORDIC任意指数函数的计算系统,包括:核心算法控制模块,通过任务调度以及连接其他模块使得整个设计方案依序执行;2型双曲旋转模式CORDIC模块,通过多次迭代计算出以2为底、任意指数的指数函数结果;2型双曲向量模式CORDIC模块,通过多次迭代计算出以2为底、任意真数的对数函数结果;基本运算模块,包括浮点转换单元、延时单元、加法单元和乘法单元,根据输入的浮点型底数、定点型指数,利用这四个单元以及上述两个模块计算并输出类浮点型结果。有益效果:本发明支持任意浮点型底数、任意定点型指数进行指数函数运算,解决了传统固定硬件电路无法实现更广范围内的指数函数运算的问题。
-
-
-
-
-
-
-
-
-