一种基于网络结构搜索技术的神经网络结构优化方法

    公开(公告)号:CN113379034A

    公开(公告)日:2021-09-10

    申请号:CN202110661438.4

    申请日:2021-06-15

    Applicant: 南京大学

    Abstract: 本申请公开了一种基于网络结构搜索技术的神经网络结构优化方法,包括以下步骤:获取训练样本,将所述训练样本输入初始神经网络,通过搜索算法根据所述训练样本,在所述初始神经网络上依次生成具有不同搜索状态的分支神经网络结构,得到若干个待优化神经网络结构,所述搜索状态包括插入分支的节点位置和对应节点位置的插入深度,对待优化神经网络结构进行优化,得到最优神经网络结构。通过搜索算法自动在初始神经网络结构上构建分支神经网络结构,对其进行优化后,得到最优神经网络分支结构,解决了现有神经网络构建过程中,通过动态计算的模型压缩算法对模型进行压缩,耗费大量人力物力,同时还存在神经网络陷入局部最优,严重影响效率的问题。

    一种图片识别方法
    22.
    发明公开

    公开(公告)号:CN112712126A

    公开(公告)日:2021-04-27

    申请号:CN202110009127.X

    申请日:2021-01-05

    Applicant: 南京大学

    Abstract: 本申请提供了一种图片识别方法,该方法采用预先训练好的图片识别模型,图片识别模型包括:主网络、分支网络、分支点以及第一处理模块;主网络为任意一种卷积神经网络模型;分支点设置于预定位置处;分支网络包括预设层数并且预设通道宽度的分支网络卷积层;预设层数以及预设通道宽度根据主网络中的下采样层确定;图片识别方法包括:主网络对待识别图片进行第一特征处理,得到第一处理图片;分支网络对第一处理图片进行识别,确定分支识别结果;第一处理模块接收分支网络输出的分支识别结果,并根据分支识别结果与分支识别结果的极大值位置确定交叉熵;如果交叉熵小于预设阈值,则输出分支识别结果。本申请提供的方法提高了图片识别精度。

    一种实现动态计算的高精度高比例的分类模型及分类方法

    公开(公告)号:CN112633402A

    公开(公告)日:2021-04-09

    申请号:CN202011607740.3

    申请日:2020-12-30

    Applicant: 南京大学

    Abstract: 本申请涉及神经网络技术领域,提供一种实现动态计算的高精度高比例的分类模型及分类方法,高精度高比例的分类模型包括主干网络模型和至少一个第一分支网络模型;主干网络模型包括输入端、输出端和多个中间层,在多个中间层的1/4‑1/3的层数之间,插入第一分支网络模型;第一分支网络模型包括分类模块和置信度确定模块。在实际应用过程中,分类模块用于产生插入处的分类输出,置信度确定模块用于判断分类输出是否满足精度要求,若满足精度要求,则高精度高比例的分类模型在第一分支网络模型的输出端提前退出,若不满足精度要求,则放弃分类模块产生的分类输出,并返回主干网络模型的中间层,继续完成分类运算。

    基于超奇异同源秘钥封装协议的公钥生成方法和装置

    公开(公告)号:CN111614465A

    公开(公告)日:2020-09-01

    申请号:CN202010412895.5

    申请日:2020-05-15

    Applicant: 南京大学

    Abstract: 本申请提供一种基于超奇异同源秘钥封装协议的公钥生成方法和装置,该方法包括:获取同源质数和椭圆曲线;在所述椭圆曲线上生成第一公共点对和第二公共点对;获取私钥,计算私核;将所述第二公共点对作为高阶同源曲线上的初始像点,以所述椭圆曲线作为初始椭圆曲线,计算获得高阶同源曲线,将高阶同源曲线上的像点作为公钥。本申请通过将输入参数转换为新的数据表示方式,并使用该方式进行相应的有限域算法,可以替代传统的蒙哥马利表示方法,采用本申请实施例提供的新的数据表示方式对SIKE方案进行实现,并且在新的数据表示方式的基础上,能够提高SIKE协议实现的效率。

    一种新型低复杂度纠错纠删DEC-RS码的解码算法及架构

    公开(公告)号:CN110545111A

    公开(公告)日:2019-12-06

    申请号:CN201810555249.7

    申请日:2018-05-28

    Applicant: 南京大学

    Abstract: 本发明公开了一种可纠错码距内纠错纠删Double-Error-Correcting Reed-Solomon(DEC-RS)码的新型超低运算量解码算法及硬件架构。纠错纠删DEC-RS码在光通信和云存储系统中有广泛的应用,目前已有的纠错纠删DEC-RS码解码算法都会存在两方面的问题,一个是迭代运算导致解码延迟较长,另一个是穷举搜索的过密度计算,本发明算法很好地解决了这些存在的问题。本发明算法中,符号错误个数用v表示,擦除错误个数用ρ表示,它们满足2v+ρ≤4,发明的算法推导出此纠错纠删DEC-RS码各种错误组合下对应的错误位置和错误数值最简洁公式表达式,运算量极大降低。同时本发明依据算法,设计出相应的最优架构,解码器硬件架构的解码延迟极大缩短。

    一种通用于LDPC码比特翻转译码算法的翻转准则

    公开(公告)号:CN109560819A

    公开(公告)日:2019-04-02

    申请号:CN201811405807.8

    申请日:2018-11-21

    Applicant: 南京大学

    Abstract: 本发明涉及LDPC码的比特翻转译码算法,提供了一种通用的翻转准则。该翻转准则包括:首先定义一个禁忌列表,采用分组判决的方式,在计算出每一个码元的可靠性值之后,根据每个码元的指示值确认其是否在禁忌列表内;禁忌列表内的码元不参与最小可靠性值的查找过程,对应最小可靠值并且不在禁忌列表中的码元将会被翻转;翻转完成后将禁忌列表清空,并将最新被翻转的码元加入禁忌列表。本发明提供的翻转准则具有很强的可扩展性,可以通过简单的修改后移植到任何一种比特翻转算法中,使得这一类算法的译码性能得到了很大的改善。由于本翻转准则复杂度低且易于硬件实现,因而保持了比特翻转算法低复杂度、高吞吐率的良好特性。

    一种LDPC码的硬判决比特翻转译码算法

    公开(公告)号:CN109510629A

    公开(公告)日:2019-03-22

    申请号:CN201811413220.1

    申请日:2018-11-21

    Applicant: 南京大学

    Abstract: 本发明涉及一种LDPC码的硬判决译码算法。该方法包括:在每一次迭代开始时先计算校验和,利用校验和与当前迭代次数判定译码是否完成;对于当前译码码字中的每一个码元,首先,判定其是否与接收码字中对应码元相等;其次,计算与该码元所连接的校验和值之和;第三,基于预设的概率值产生一个值为0或1的随机惩罚项。上述三部分之和为该码元的能量值。能量值反映每个码元的可靠性,对应能量值最大的码元将会被翻转。本发明的算法只需要利用硬消息进行译码,因此其译码复杂度很低。应用本发明的算法能够大大降低硬判决译码被困在捕获集中的概率。在软消息无法获得的情况下,如BEC信道,本发明所公开的译码算法大幅提高了对传输数据的纠错能力。

    一种高性能低复杂度的NB-LDPC码译码方法

    公开(公告)号:CN108092671A

    公开(公告)日:2018-05-29

    申请号:CN201711499749.5

    申请日:2017-12-27

    Applicant: 南京大学

    Inventor: 王中风 田静 林军

    Abstract: 本发明公开了一种高性能低复杂度的非二进制低密度奇偶校验(NB-LDPC)码译码方法,属于通信技术领域。该方法从两个方面实现了高性能低复杂度的目标:1)首先,结合了具有高性能的简化最小和方法(SMSA)和基于网格的扩展最小和方法(T-EMSA)各自的优势,提出了改进的基于网格的最小和方法(IT-MSA),在相同条件下,IT-MSA获得了比原始方法稍优的性能和复杂度的降低;2)另外,将基于双阈值收缩方法(DTBS)应用到了IT-MSA中,进一步将计算复杂度进行大幅降低,而译码性能基本保持不变。经过这两个步骤的处理,本发明的译码方法的性能与最优的扩展最小和(EMSA)相当,而复杂度与EMSA、SMSA和T-EMSA相比,均有大幅降低。

    一种基于硬件平台的softmax实现方式

    公开(公告)号:CN108021537A

    公开(公告)日:2018-05-11

    申请号:CN201810016954.X

    申请日:2018-01-05

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于各种硬件平台(CPLD、FPGA、专用芯片等)计算softmax函数的实现方式。softmax函数广泛应用于深度学习的多分类任务及注意力模型等,其中涉及到的e指数及除法计算需要消耗较多的硬件资源。设计方法通过对函数进行数学变换,将其中的e指数计算简化为一次常数乘法、一个输入范围固定的2的指数次运算和一次移位运算;将n次除法运算的简化为一次“最高非零位检测运算”、一次输入范围固定的倒数运算和一次移位运算及n次乘法运算。其中2指数及倒数运算以特殊设计的查找表实现,能以更小的存储空间实现同样精度。将本发明用在深度学习的注意力模型等中,可以在精度几乎不受损的前提下大大提高计算速度,减少计算资源和存储资源的消耗。

    一种适用于多种卷积模式的FIR滤波器实现

    公开(公告)号:CN107862381A

    公开(公告)日:2018-03-30

    申请号:CN201711101343.7

    申请日:2017-11-06

    Applicant: 南京大学

    Inventor: 王中风 袁炅 林军

    CPC classification number: G06N3/063 H03H17/06 H03H2017/0081

    Abstract: 本发明公开了一种可适用于多种卷积模式的FIR滤波器及其硬件实现,该结构可以支持目前卷积神经网络中主流的卷积运算,如步长为1的3*3和5*5的卷积计算以及步长为2的3*3卷积运算等,并运用6并行快速FIR算法来减小硬件消耗,降低卷积计算复杂度,提高数据吞吐率。本发明完成了步伐为2的三并行卷积运算的硬件结构推导,并在不增加加法器与乘法器的基础上将其与6并行快速FIR滤波器硬件结构相结合,使得该结构在适配的每种模式下都极大得利用了硬件资源。本发明通过该单一硬件结构的不同配置可以实现目前绝大多数主流的卷积神经网络计算,提高了硬件利用率,具备了高通用性,简化了卷积神经网络的硬件实现。

Patent Agency Ranking