-
公开(公告)号:CN112650974B
公开(公告)日:2023-10-13
申请号:CN202011617770.2
申请日:2020-12-30
Applicant: 南京大学
Abstract: 本申请公开了一种高效的转置卷积计算方法,基于预设的转置卷积核的尺寸参数、转置卷积的步长和转换阶数确定转置卷积总体架构,对用于原特征图的提取的滑动窗口进行了设计,根据设计后的滑动窗口提取特征图子图,对所述特征图子图进行转换,转换转置卷积核,并进行计算,对中间子矩阵进行转换,进而获得转置卷积结果。本申请实现在不需要补零的操作下,对原特征图进行转置卷积运算,提高运算效率;提出转换阶数的设置,扩大适用范围,进一步降低计算复杂度。
-
公开(公告)号:CN116029332B
公开(公告)日:2023-08-22
申请号:CN202310147794.3
申请日:2023-02-22
Applicant: 南京大学
IPC: G06N3/0442 , G06N3/048 , G06N3/084 , G06N3/063
Abstract: 本申请提供一种基于LSTM网络的片上微调方法及装置,方法包括:根据LSTM网络模型的参数,生成计算参数;根据计算参数对输入值和权重值进行细粒度切分,以及生成指令集合;在神经网络处理器NPU读取指令集合;根据指令集合执行NPU片上计算,以生成中间值和LSTM网络输出值;将LSTM网络输出值传输至误差函数,并通过误差函数得到误差值;根据误差值,更新所述权重值以及偏置值;使用更新后的权重值以及偏置值反向传播,以根据指令集合执行新一轮NPU片上计算。本申请提供的方法通过CPU、NPU协同,将LSTM网络中的运算分工,以解决CPU、GPU无法快速高效的计算LSTM网络的问题。
-
公开(公告)号:CN116131863A
公开(公告)日:2023-05-16
申请号:CN202310327458.7
申请日:2023-03-30
Applicant: 南京大学
IPC: H03M7/40
Abstract: 本发明提供了一种面向多种可变字长编码的码字拼接装置,包括预拼接模块、桶形移位模块、位拼接模块、寄存器选择模块;所述预拼接模块包含位扩展器、加法器和桶形移位寄存器,所述扩展器用于低位补零,所述加法器用于输出拼接后的不定长码字实际位宽,所述桶形移位寄存器用于向右移位;所述桶形移位模块用于进行循环移位;所述位拼接模块通过乒乓结构轮流负责位拼接和缓存尚未进行位拼接的数据;所述寄存器选择模块用于进行寄存器选择。本发明能够高效地对各种可变字长编码算法产生的多种不定长码字进行数据拼接且不会出现堵塞,且使数据流以字节为单位进行输出。
-
公开(公告)号:CN115544447A
公开(公告)日:2022-12-30
申请号:CN202211270781.7
申请日:2022-10-17
Applicant: 南京大学
Abstract: 本申请提供一种点积运算装置,所述点积运算装置包括:译码模块、符号与指数运算模块、指数比较求差模块、尾数乘法模块、加法器、有效数对齐模块、符号处理与尾数相加模块、尾数归一与指数调整模块和编码与舍入模块,由于采用融合操作,在加法器内无需进行中间结果的译码和编码与舍入功能,导致本申请所需译码模块和编码与舍入模块的数量减少,因此减小了硬件面积和硬件功耗;并且,由于减少了译码模块和编码与舍入模块,因此计算的关键路径缩短,从而减小了计算延迟;进一步的,由于每个编码与舍入模块在数据输出时均根据输出精度的限制进行舍入,因此编码与舍入模块减少导致整个计算过程需要舍入的次数减少,从而提升了点积结果的精度。
-
公开(公告)号:CN115276729A
公开(公告)日:2022-11-01
申请号:CN202210864604.5
申请日:2022-07-21
Applicant: 南京大学
IPC: H04B7/0413 , H04L25/02
Abstract: 本申请提供一种面向大规模MIMO系统的信号检测方法及系统,根据发送端的天线数目和接收端的天线数目,确定第一阻尼系数和第二阻尼系数;根据接收信号、信道矩阵、平均符号能量和第一阻尼系数,确定发送信号后验概率分布的初始均值;利用SORI方法对发送信号的后验概率分布的均值进行SORI迭代,根据完成SORI迭代后的均值向量,确定腔边缘概率服从的高斯分布的初始均值;采用EPA迭代方法,迭代更新腔边缘概率服从的高斯分布的均值,将达到EPA预设迭代次数的腔边缘概率服从的高斯分布的均值作为发送信号的估计值。将SORI和EPA算法相结合,利用SORI来近似EPA算法初始化部分的矩阵求逆,从而大大提高收敛速度。
-
公开(公告)号:CN115270155A
公开(公告)日:2022-11-01
申请号:CN202210910137.5
申请日:2022-07-29
Applicant: 南京大学
Abstract: 本申请涉及计算机应用技术领域,提供一种获取大数拓展最大公约数的方法及硬件架构,控制模块、GCD计算单元、贝祖系数计算单元、第一多路选择器、第二多路选择器、终止模块和input_valid信号,GCD计算单元和贝祖系数计算单元用于根据控制模块的控制信号迭代更新中间变量,通过δ参数的引入,避免比较中间变量a和b的大小,基于k‑ary算法的同时引入贝祖系数的计算和冗余形式,在硬件实现中只需要简单的加减法以及移位操作,大幅度降低加法运算所需的时间,达到提高时钟频率的目的,减少迭代周期,缩短总运行时间。
-
公开(公告)号:CN115225202A
公开(公告)日:2022-10-21
申请号:CN202210192714.1
申请日:2022-03-01
Applicant: 南京大学
IPC: H04L1/00
Abstract: 本申请利用传输数据经过调制后,每个传输符号的低位比高位更容易出错的特性,提出一种外码采用RS码,内码运用多层编码思想的级联编码及译码方法。所述级联编码方法的外码采用RS码,对RS码字数据进行交织,将交织后的数据分成预设数量组的比特数据,对每一组比特数据采用不同码率的码字进行编码,得到预设数量组的多层子码字数据,进行调制得到调制数据;其中每组多层子码字数据的长度一致,分别对应调制数据中的不同位。所述级联编码方法在码率一定的情况下,使用较短的码长实现较高的编码增益;级联译码使用低位译码结果辅助对信道接收数据中的高位数据进行解调译码,获得较高的译码性能,满足400Gb/s以上以太网的译码性能需求。
-
公开(公告)号:CN114978197A
公开(公告)日:2022-08-30
申请号:CN202210541236.0
申请日:2022-05-18
Applicant: 南京大学
IPC: H03M13/13
Abstract: 本发明公开了一种极化码特殊形式节点的快速译码方法。设极化码的某一节点的叶节点所对应的比特位为(u0,u1,...,uN‑1),其中N=2n,若其符合u0,u1,...,uN/2‑2,uN/2,uN/2+1,...,uN‑2均为冻结比特,仅有uN/2‑1,uN‑1为信息比特,称此节点为双重复(Binary Repetition,BI‑REP)节点。本方法可以绕过原始的串行抵消(SC)译码过程,直接估计码字比特,无需对BI‑REP节点的子节点进行访问,在避免大量计算的同时降低译码延时。并且该方法与传统的对子节点全部访问的方法是完全等价的,不会引起任何译码性能损失。上述优势使本发明具有广泛的应用前景。
-
公开(公告)号:CN114638703A
公开(公告)日:2022-06-17
申请号:CN202210348393.X
申请日:2022-04-01
Applicant: 南京大学
Abstract: 本申请涉及金融风险管理技术领域,提供一种基于灰色混合模型的金融时间序列短期预测方法,该预测方法针对传统灰色模型进行改进,通过采用离散小波变换对原数据序列进行处理,有效去除高频的细小波动,从而提高模型对数据的预测精度,进而使得金融时间序列预测效果更佳;通过将历史数据结合不同长度择优设置一个滑动窗口来限制数据序列长度,已解决过多的历史数据中存在大量无用信息,过少的数据不足以预测这一难题;还通过将预处理后的原数据经过灰色模型预测之后,根据发展系数对预测结果进行移动加权平均计算,从而避免不可预料的趋势变化带来巨大误差,进而使得最终结果比灰色模型的预测结果具有更高精度。
-
公开(公告)号:CN114492753A
公开(公告)日:2022-05-13
申请号:CN202210094538.8
申请日:2022-01-26
Applicant: 南京大学
Abstract: 本申请实施例提供的一种应用于片上训练的稀疏加速器,通过在不同的加速阶段动态调整输入数值缓冲模块中的多个输入数值、参考数值缓冲模块中的多个参考数值以及掩码缓冲模块中的掩码,以及使粗粒度单元以粗粒度对无效运算进行初步筛选,以及使处理模块中每个处理单元包括的细粒度单元以细粒度对无效运算进行进一步筛选,从而剔除片上训练三个训练阶段中全部的无效运算,此外,多个计算核可以进行并行加速处理,多个计算核中处理模块包括的多个处理单元也可以进行并行加速处理,进一步提高了稀疏加速器的硬件利用率。如此,本申请的一种应用于片上训练的稀疏加速器可以高效、准确地剔除片上训练三个阶段的所有无效运算。
-
-
-
-
-
-
-
-
-