-
公开(公告)号:CN114785356A
公开(公告)日:2022-07-22
申请号:CN202210541237.5
申请日:2022-05-18
Applicant: 南京大学
Abstract: 本发明公开了一种减少路径分裂的极化码列表连续消除(SCL)译码方法,属于信道编码技术领域。该方法能够在尽量保证译码性能不损失的同时,减少SCL译码时的分裂次数,从而减少译码的计算量。该方法的特征在于:找出一个码字的最后一位冻结位,在此冻结位之后的x位信息位序列尾部由高位向低位选出y位,采用SC译码方法(不分裂),其他位采用SCL译码方法(分裂)。这种译码方式减少了SCL译码分裂次数,性能却没有显著下降,使本发明具有广泛的运用前景。
-
公开(公告)号:CN114742216A
公开(公告)日:2022-07-12
申请号:CN202210412651.6
申请日:2022-04-19
Applicant: 南京大学
Abstract: 本申请公开了一种基于反向流水线的异构训练加速器,该加速器包括数据模块、控制模块和计算模块;控制模块控制BP阶段前向反向计算核执行第一通道的卷积运算,并控制所述归一池化计算核对卷积运算结果进行处理,得到当前卷积层的第一通道的第一输出误差,并将第一输出误差传入WG计算核,同时控制WG计算核根据第一输出误差以及前一卷积层的第一通道的输入值,执行深度神经网络的WG阶段所对应的卷积运算。该加速器BP和WG过程的流水线并行处理,降低了系统延时、避免了数据在不同层级存储的额外传输,降低了功耗,同时其异构架构设计可以实现对不同类型的计算单独优化,提高能耗比和加速比。
-
公开(公告)号:CN114418088A
公开(公告)日:2022-04-29
申请号:CN202111628710.5
申请日:2021-12-28
Applicant: 南京大学
IPC: G06N3/08 , G06N3/04 , G06K9/62 , G06F16/332 , G06F40/295 , G06F16/35
Abstract: 本申请提供一种模型训练方法,包括定义一个新的量化线性层;将量化线性层的多维输入张量中全部元素量化为PINT格式,对量化线性层的待计算张量中全部元素量化为PINT数据格式,将量化后的多维输入张量和待计算张量进行矩阵乘计算得到定点结果;将定点结果反量化为浮点数并传播到后续网络层;将模型中原有的线性层替换为量化线性层,以及基于浮点数和PINT数据格式对模型进行训练。本申请开发了一种基于PINT数据格式的量化线性层,将低比特、高表示能力的PINT数据格式应用到模型训练,用量化线性层替换模型中使用到的线性层,使得在训练出的模型准确度变化很小的情况下有效的降低了数据计算和存储等方面的需求。
-
公开(公告)号:CN112838870A
公开(公告)日:2021-05-25
申请号:CN201911161917.9
申请日:2019-11-22
Applicant: 南京大学
IPC: H03M13/11
Abstract: 本发明公开了一种高性能低复杂度的基于可靠性的多进制LDPC译码方法。该方法主要包括两个创新点:(一)针对导致译码失败的主要原因:周期点问题,以一定的周期间隔将一种微小加性扰动注入译码过程,有效地解决了周期点问题,从而极大地提升了译码性能;(二)针对多进制LDPC译码需要存储大量信道信息的问题,提出一种实时计算信道信息的方法,有效地减少了存储复杂度且不造成性能损失。本发明提出一种有效的译码方法,以较低的计算以及存储复杂度实现了更好的译码性能,具有一定的创新性。
-
公开(公告)号:CN112650974A
公开(公告)日:2021-04-13
申请号:CN202011617770.2
申请日:2020-12-30
Applicant: 南京大学
Abstract: 本申请公开了一种高效的转置卷积计算方法,基于预设的转置卷积核的尺寸参数、转置卷积的步长和转换阶数确定转置卷积总体架构,对用于原特征图的提取的滑动窗口进行了设计,根据设计后的滑动窗口提取特征图子图,对所述特征图子图进行转换,转换转置卷积核,并进行计算,对中间子矩阵进行转换,进而获得转置卷积结果。本申请实现在不需要补零的操作下,对原特征图进行转置卷积运算,提高运算效率;提出转换阶数的设置,扩大适用范围,进一步降低计算复杂度。
-
公开(公告)号:CN112118013A
公开(公告)日:2020-12-22
申请号:CN201910546357.2
申请日:2019-06-20
Applicant: 南京大学
IPC: H03M13/11
Abstract: 本发明公开了一种适用于多进制LDPC码的高性能、低复杂度的迭代大数逻辑译码方法。该方法主要包括三个创新点:(一)提出两个减少实现复杂度的改进方法,在计算先验可靠性度量值时把寻找两个最小值的操作简化为寻找一个最小值操作,由此把所需的比较操作降低一半且几乎不造成性能损失;其次,在计算总的可靠性度量值时将大量的整数乘法转化为极少数量的除法,大大减少乘法操作的同时也降低了可靠性度量值的比特位宽;(二)提出一种不饱和限幅的方法,通过提升其他域元素的竞争力,极大地提升了译码性能并进一步降低可靠性度量值的比特位宽;(三)针对多进制LDPC译码存储消耗巨大的问题,提出了一种部分固定的存储方法,极大地减少了对应的存储消耗。本发明提出一种有效的译码方法,在提升译码性能的同时降低了实现复杂度,具有一定的创新性。
-
公开(公告)号:CN111654353A
公开(公告)日:2020-09-11
申请号:CN201910162244.2
申请日:2019-03-04
Applicant: 南京大学
IPC: H04L1/00
Abstract: 随着400G以太网的技术日趋成熟,下一代以太网的研究工作也陆续开展起来,前向纠错码(FEC)方案的选取仍然是下一代以太网研究中的一个重要课题。下一代以太网仍然有望采用至少4路光纤的方案实现,为达到高于800Gbps的总吞吐率,FEC解码器需要在满足编码增益的条件下达到200Gbps甚至更高的吞吐率。在保证高吞吐率的同时,尽可能减少解码器的功耗。本发明公开了一种面向下一代以太网的FEC方案及其解码器的硬件架构。我们采用Hamming码作为外码和RS码作为内码的级联码方案,外码采用软解码,内码采用硬解码。此外,我们还设计了该级联码解码器的硬件架构,经过硬件综合和分析,该解码器可以达到200Gbps的吞吐率。
-
公开(公告)号:CN111428189A
公开(公告)日:2020-07-17
申请号:CN202010249282.4
申请日:2020-04-01
Applicant: 南京大学
Abstract: 本申请实施例公开了一种用于反卷积运算的数据预处理方法及装置,通过根据反卷积核的尺寸以及所述反卷积核的步长,设定多个抽取起始点,并根据所述多个抽取起始点,分别按照预设的抽取间隔,对所述反卷积核进行元素抽取,获取多个子卷积核,其中,不同的抽取起始点对应获取不同的子卷积核,每一个所述子卷积核包括抽取所得的多个元素。上述方法中,硬件加速器在针对子卷积核与输入矩阵执行相乘累加操作时,不会存在大量的无效操作,提高了硬件加速器的计算效率,也无需额外的寄存器存储无效操作得到的中间结果,节省了硬件加速器的存储资源。
-
公开(公告)号:CN111367497A
公开(公告)日:2020-07-03
申请号:CN202010138192.8
申请日:2020-03-03
Applicant: 南京大学
Abstract: 本申请提供了一种基于posit数据格式的浮点数乘法运算方法及装置。所述方法包括:获取第一浮点数和第二浮点数之后,分别对第一浮点数和第二浮点数进行分析,根据分析后得到的值,确定目标浮点数。采用posit数据格式进行乘法运算,则可以在0附近保证精度的同时,又可以很大程度的减少数据位宽,从而减少神经网络的训练时间,也降低了对于存储,位宽等资源的需求。
-
公开(公告)号:CN111313911A
公开(公告)日:2020-06-19
申请号:CN201911161919.8
申请日:2019-11-22
Applicant: 南京大学
Abstract: 本发明公开了一种适用于5G LDPC码的高性能、低复杂度的度自适应定点化译码算法。在5G LDPC码中,很大一部分变量节点的列重为1,因此这些节点在每次迭代中只能接收到一个校验消息,导致其对所接收校验消息的精度极其敏感,从而具有较高的出错概率。基于此,本发明公开了一个新的校验方程,其精度逼近置信传播算法但复杂度仅与最小和算法近似。此外,考虑到5G LDPC码的行重和列重都极不规则,采用了列重自适应来对列重较高的变量节点进行特殊处理。仿真结果表明与目前最优的算法相比,本发明提出的算法可以在保证低复杂度的前提下,获得0.4dB的性能增益,从而大大提升了5G LDPC码的纠错性能。
-
-
-
-
-
-
-
-
-