一种极化码的自适应连续消除优先译码方法

    公开(公告)号:CN113131950B

    公开(公告)日:2024-02-13

    申请号:CN202110442919.6

    申请日:2021-04-23

    Applicant: 南京大学

    Abstract: 本发明提供了一种极化码的自适应连续消除优先译码方法,其中所述方法采用基于优先级的搜索策略和网格存储策略,使用优先队列存储优先级信息并根据码字的子节点类型指导候选路径的扩展,使用网格结构计算并存储中间结果,同时采用一种基于路径度量的自适应节点插入策略来减少优先队列中的路径数量,通过优先级队列与网格结构的迭代信息交互,完成极化码译码。本发明的目的在于,利用优先级搜索策略降低译码算法的复杂度,通过自适应节点插入策略避免了大多数不必要的路径扩展,在保证译码性能的同时,显著降低了算法的时间复杂度。

    基于余数系统和BFV方案的同态加密重线性化方法及系统

    公开(公告)号:CN115203718A

    公开(公告)日:2022-10-18

    申请号:CN202210567493.1

    申请日:2022-05-24

    Applicant: 南京大学

    Abstract: 基于余数系统和BFV方案的同态加密重线性化方法及系统,所述方法包括读取同态乘法计算得到的第三项密文多项式;将所述第三项密文多项式按照RNS的各个基进行分解,获得每个基的分量;将所述每个基的分量复制到RNS各个基对应的若干组通道中,形成分解后的第三项密文多项式组;对所述分解后的第三项密文多项式组和两组重线性化密钥组进行NTT变换,并对其结果依序进行内积运算和INTT变换,得到两组第三项密文多项式的输出结果;将两组第三项密文多项式的输出结果,分别与同态乘法计算得到的第一项密文多项式、第二密文多项式相加,获得重线性化后的两项密文。通过对同态乘法中运算量最大的重线性化部分进行加速,大大提高了同态乘法的效率。

    一种极化码的自适应连续消除优先译码方法

    公开(公告)号:CN113131950A

    公开(公告)日:2021-07-16

    申请号:CN202110442919.6

    申请日:2021-04-23

    Applicant: 南京大学

    Abstract: 本发明提供了一种极化码的自适应连续消除优先译码方法,其中所述方法采用基于优先级的搜索策略和网格存储策略,使用优先队列存储优先级信息并根据码字的子节点类型指导候选路径的扩展,使用网格结构计算并存储中间结果,同时采用一种基于路径度量的自适应节点插入策略来减少优先队列中的路径数量,通过优先级队列与网格结构的迭代信息交互,完成极化码译码。本发明的目的在于,利用优先级搜索策略降低译码算法的复杂度,通过自适应节点插入策略避免了大多数不必要的路径扩展,在保证译码性能的同时,显著降低了算法的时间复杂度。

    一种基于极化码的自适应堆栈译码方法及系统

    公开(公告)号:CN109450456A

    公开(公告)日:2019-03-08

    申请号:CN201811284264.9

    申请日:2018-10-30

    Applicant: 南京大学

    Abstract: 本发明涉及基于极化码的自适应堆栈译码方法及系统,该系统包括:控制单元,路径计算单元,决策单元,堆栈排序单元。所述的控制单元为整个译码过程提供了控制信息;所述的路径计算单元计算出每条路径的转移概率;所述的决策单元通过两种配合使用的自适应策略来限制搜索宽度和存储堆栈深度;所述的堆栈排序单元对所有的候选路径按转移概率从大到小进行排序。有益效果:本发明提出了两种自适应策略,新增了决策单元,通过路径剪枝操作,大大降低了算法的计算复杂度和空间复杂度,并保证了译码性能,适用于各种信道场景。

    一种基于线性分段的softmax硬件实现方法

    公开(公告)号:CN113377332B

    公开(公告)日:2023-08-22

    申请号:CN202110591328.5

    申请日:2021-05-28

    Applicant: 南京大学

    Abstract: 本发明提出了一种基于线性分段的softmax硬件实现方法,该方法实现的电路系统包括:控制器用于实现softmax运算所需的源数据的读取和分发,以及运算结果的存储;排序模块用于将输入进行排序,并找出最大值;自然指数模块用于计算输入源数据的e指数函数值;加法树模块用于将e指数模块的结果进行累加;除法模块用于计算每个e指数计算结果与累加结果的比值。该方法实现的电路系统通过分解计算过程、压缩计算区间,大幅降低了传统查找表方法实现softmax的参数,兼具了高性能和低硬件资源开销,可用于各种人工智能算法加速场景。

    模乘精简的同态加密神经网络线性层硬件加速方法及系统

    公开(公告)号:CN115776367A

    公开(公告)日:2023-03-10

    申请号:CN202211356621.4

    申请日:2022-11-01

    Applicant: 南京大学

    Abstract: 本发明公开了一种模乘精简的同态加密神经网络线性层硬件加速方法及系统,该方法包括:用户端接收输入的神经网络模型的权重数据,并采用加法二次幂方法进行量化,然后进行重排和转置;用户端接收输入的神经网络模型的源数据,并采用img2col的方式进行重排,然后进行转置,并编码为明文多项式;用户端将编码后的明文多项式加密为同态加密方案对应的密文,并与处理后的权重数据一起发送到硬件加速器;硬件加速器对密文和权重数据开启同态加密条件下的神经网络线性层运算,并将运算结果反馈到用户端。本发明减小了模乘运算器的计算周期和资源开销,提升了计算效率。

    片上网络温度预测方法及装置、设备、存储介质

    公开(公告)号:CN111026603B

    公开(公告)日:2021-04-23

    申请号:CN201911026334.5

    申请日:2019-10-25

    Applicant: 南京大学

    Abstract: 公开了一种片上网络温度预测方法、装置、设备和存储介质。本申请一实施例中,片上网络温度预测方法可以包括:获取片上网络中各个处理器在当前时刻之后预定时长内待处理指令的指令信息;根据所述待处理指令的指令信息,计算片上网络在当前时刻之后预定时长内的功耗;根据片上网络在当前时刻之后预定时长内的功耗、片上网络当前时刻的温度,计算片上网络在预定时刻的温度,所述预定时刻是当前时刻之后的时刻且与当前时刻相差所述预定时长。本申请能够避免因负载波动大而导致的片上网络温度预测准确度降低的问题。

    一种应用于CNN网络卷积层的高效存算系统及其运算方法

    公开(公告)号:CN112052941A

    公开(公告)日:2020-12-08

    申请号:CN202010947798.6

    申请日:2020-09-10

    Applicant: 南京大学

    Abstract: 本发明提出了一种应用于CNN网络卷积层的高效存算系统及其运算方法,该架构包括:用于缓存结果数据的数据缓存模块;用于进行高并行全流水卷积运算,得到卷积运算结果的运算阵列;用于读取数据缓存中的图像源数据并发送给所述运算阵列的源数据分发模块;用于读取数据缓存中的权重数据,并将数据复制重新编组,发送给所述运算阵列的权重共享模块;用于将运算阵列卷积计算结果存入所述数据缓存模块中的结果数据写入模块。本发明提出的高效存算架构基于全流水的并行运算簇设计了运算阵列,并且设计与之匹配的数据缓存和高带宽供数通道,以较低的硬件复杂度,实现了CNN网络密集卷积算法的高性能运算,具有良好的应用前景。

    一种多通道无冲突拆分的硬件实现方法及运行该方法的计算机设备与可读存储介质

    公开(公告)号:CN111045965A

    公开(公告)日:2020-04-21

    申请号:CN201911025671.2

    申请日:2019-10-25

    Applicant: 南京大学

    Abstract: 本发明涉及一种多通道无冲突拆分的硬件实现方法及运行该方法的计算机设备与可读存储介质,该方法基于DMA接口单元、控制单元、数据存储单元、无冲突访存单元和数据重组单元实现。DMA接口单元用于DDR和SRAM之间的数据交互;控制单元用于根据配置信息选择数据存储单元划分模式和无冲突访存单元访存模式;数据存储单元用于存储源数据和结果数据;无冲突访存单元通过地址映射将按采样点输入的源数据按通道存入数据存储单元;数据重组单元用于根据配置信息重组结果数据,送至DMA接口单元进行结果输出。本发明对采样点数、通道数没有限制,适用于数字信号处理和人工智能场景,具有高通用性、高并行路数、高存储资源利用率和低控制复杂度的特点。

    一种应用于CNN网络卷积层的高效存算系统及其运算方法

    公开(公告)号:CN112052941B

    公开(公告)日:2024-02-20

    申请号:CN202010947798.6

    申请日:2020-09-10

    Applicant: 南京大学

    Abstract: 本发明提出了一种应用于CNN网络卷积层的高效存算系统及其运算方法,该架构包括:用于缓存结果数据的数据缓存模块;用于进行高并行全流水卷积运算,得到卷积运算结果的运算阵列;用于读取数据缓存中的图像源数据并发送给所述运算阵列的源数据分发模块;用于读取数据缓存中的权重数据,并将数据复制重新编组,发送给所述运算阵列的权重共享模块;用于将运算阵列卷积计算结果存入所述数据缓存模块中的结果数据写入模块。本发明提出的高效存算架构基于全流水的并行运算簇设计了运算阵列,并且设计与之匹配的数据缓存和高带宽供数通道,以较低的硬件复杂度,实现了CNN网络密集卷积算法的高性能运算,具有良好的应用前景。

Patent Agency Ranking