-
公开(公告)号:CN116070072A
公开(公告)日:2023-05-05
申请号:CN202310054131.7
申请日:2023-02-03
Applicant: 杭州国芯科技股份有限公司
IPC: G06F17/16
Abstract: 本发明公开了一种矩阵运算中转置、转置乘和相乘的方法。本发明通过矩阵转置处理单元、矩阵转置乘处理单元、输出单元和两个中间缓存实现。矩阵转置处理单元对输入数据进行转置处理;矩阵转置乘处理单元获取两个输入矩阵的数据,进行一个矩阵的转置乘另一个矩阵的处理;输出单元从中间缓存取出数据写入外部存储器;矩阵转置处理单元和矩阵转置乘处理单元共用一个输出单元;中间缓存存储处理过程中的数据,当输出单元使用一个中间缓存进行输出时,处理单元使用另一个中间缓存进行数据缓存。本发明方法使用矩阵转置乘的方式,两个矩阵相乘采用列数据运算方法,减少了数据的重复取用的次数和中间缓存的面积,并节省了总线带宽和运算时间。
-
公开(公告)号:CN113160093B
公开(公告)日:2022-07-01
申请号:CN202110564208.6
申请日:2021-05-24
Applicant: 杭州国芯科技股份有限公司
Abstract: 本发明公开了一种图像的自适应宽动态模式调节方法。现有方法采用传统的固定式的调节,对场景适应性不好。本发明方法首先通过对所需分析的图像亮度域进行亮度统计,得到直方图区间,然后对直方图的数据进行场景分析,得到对于场景判断的各项调整系数;最后根据各个调整系数进行两次判断,可以有效的保证算法的鲁棒性。本发明方法能够有效地对当前场景的复杂度进行分析,识别当前场景所需动态范围,从而控制摄像机进行宽动态与非宽动态之间的模式切换。
-
公开(公告)号:CN112259048A
公开(公告)日:2021-01-22
申请号:CN202011154950.1
申请日:2020-10-26
Applicant: 杭州国芯科技股份有限公司
IPC: G09G3/3208 , G09G5/10
Abstract: 本发明公开了一种自适应Gamma曲线调节方法。现有方法采用单一的Gamma曲线调节,适应性不好。本发明方法首先通过对所需分析的图像亮度域进行亮度统计,得到直方图区间,然后对直方图区间进行分区比例系数运算,得到各区间调整系数;设定低对比度Gammalow曲线和高对比度Gammahigh曲线;最后根据各个直方图区间的调整系数和划分阈值对Gammalow曲线和Gammahigh曲线进行拟合。本发明方法可以自适应调整对比度、亮度,能够有效地对当前场景的复杂度进行分析,识别当前场景所需对比度,可以更加精确的根据场景、光源的变换进行自适应的Gamma曲线校正。
-
公开(公告)号:CN109887006A
公开(公告)日:2019-06-14
申请号:CN201910086650.5
申请日:2019-01-29
Applicant: 杭州国芯科技股份有限公司
Abstract: 本发明涉及一种基于帧差法加速神经网络运算的方法。本发明方法对参考帧通过神经网络各层进行运算,保存线性矩阵运算的输入值和运算结果;对除参考帧以外各帧的处理包括线性矩阵运算部分和非线性运算部分。线性矩阵运算部分:将神经网络的连续输入序列的第k帧xn,k减去前m帧xn,k-m,通过小值清零变换得到Δxn,k,将Δxn,k作为第n层输入,得到线性矩阵运算输出Δyn,k,得到第n层第k帧的线性输出结果yn,k,进而得到第n层的非线性运算输出结果yn,k′;将yn,k′-yn,k-m′通过小值清零变换后的结果作为第n+1层神经网络线性矩阵运算的帧差值Δxn+1,k,最终得到第n+1层第k帧的线性矩阵运算输出结果yn+1,k;依次类推,直到最终输出结果。对于神经网络非线性运算部分采用常规方法运算。本发明方法可以加速神经网络运算,减少神经网络运算时间。
-
公开(公告)号:CN109635936A
公开(公告)日:2019-04-16
申请号:CN201811641867.X
申请日:2018-12-29
Applicant: 杭州国芯科技股份有限公司
CPC classification number: G06N3/0454 , G06N3/08
Abstract: 本发明涉及一种基于重训练的神经网络剪枝量化方法。本发明方法首先载入已训练好的神经网络模型,对训练好的神经网络模型中的权重和数据同时进行剪枝处理和量化处理,对权重更新以及迭代重训练,将完成重训练得到的神经网络模型进行测试集评估,依据评估结果判断是否保存该模型;同时根据设定的条件,判断是否重新进行下一轮重训练;最后依据神经网络模型压缩比评价指标,从保存的模型中输出最优的剪枝量化模型。本发明方法将剪枝量化技术加入到深度网络重训练中,对模型的权重和数据同时做剪枝量化处理,通过重训练,得到一种更适合于推断的权重分布,在保持原模型精度下,取得较好的网络压缩收益,提升神经网络模型在实际推断中的速度。
-
公开(公告)号:CN108122031A
公开(公告)日:2018-06-05
申请号:CN201711379852.6
申请日:2017-12-20
Applicant: 杭州国芯科技股份有限公司
IPC: G06N3/063
Abstract: 本发明涉及一种低功耗的神经网络加速器架构。现有技术功耗高、启动慢,数据吞吐量大。本发明包括CPU、神经网络加速模块、只读存储模块、内部可读写随机存储器、外部可读写随机存储器、可读写非易失性存储器、电源管理模块、两个电源域。神经网络加速模块,用于对神经网络的命令进行硬件加速,并支持权重拆分和按结构拆分的神经网络;只读存储模块,用于存储固化的神经网络权重参数和结构参数;内部可读写随机存储器为SRAM,外部可读写随机存储器为DRAM;两个电源域分为高频开启电源域A和低频开启电源域B。本发明升级过程中不需要更换所有掩膜,只需要更改其中一层掩膜,大幅降低了升级成本。
-
公开(公告)号:CN107885509A
公开(公告)日:2018-04-06
申请号:CN201711013715.0
申请日:2017-10-26
Applicant: 杭州国芯科技股份有限公司
Abstract: 本发明涉及一种基于安全的神经网络加速器芯片架构。本发明包括神经网络加速模块、一次性可烧写模块、内容解密模块、片外安全区域管理模块。神经网络加速模块用于对神经网络的命令进行硬件加速。一次性可烧写模块用于对内容解密模块的密钥管理和片外安全区域划分的地址管理。内容解密模块用于对加密的神经网络命令和参数进行解密操作。片外安全区域管理模块用于根据一次性可烧写模块硬连接的片外安全区域对各个模块访问片外存储器时的权限进行控制。所述的神经网络加速模块包括安全管理模块和可编程运算单元。采用本发明提出的技术方案,即使黑客知晓整个内容保护流程,也无法导出神经网络模型。
-
公开(公告)号:CN117669674A
公开(公告)日:2024-03-08
申请号:CN202311824684.2
申请日:2023-12-27
Applicant: 杭州国芯科技股份有限公司
IPC: G06N3/063
Abstract: 本发明涉及一种神经网络小内存芯片架构。目前神经网络微型化趋势盛行,MCU和FPGA方案的体积劣势明显。本发明提出一个芯片硬件架构,包括通过总线进行通信的输入采集模块、处理器CPU、存储器FLASH、运行内存SRAM、神经网络模块、输出模块。采用SRAM作为系统运行内存,用于缓存神经网络运行时的所有数据,神经网络的命令FIFO,神经网络命令对应的地址信息表以及CPU运行时的数据;采用FLASH作为系统存储器,用于存储神经网络的权重和结构指令以及CPU的程序和只读数据。本发明芯片架构中,处理器CPU和神经网络模块并行运行,提升了运行效率。本发明在神经网络运行时复用内存空间,达到减小内存空间的效果。
-
公开(公告)号:CN113160093A
公开(公告)日:2021-07-23
申请号:CN202110564208.6
申请日:2021-05-24
Applicant: 杭州国芯科技股份有限公司
Abstract: 本发明公开了一种图像的自适应宽动态模式调节方法。现有方法采用传统的固定式的调节,对场景适应性不好。本发明方法首先通过对所需分析的图像亮度域进行亮度统计,得到直方图区间,然后对直方图的数据进行场景分析,得到对于场景判断的各项调整系数;最后根据各个调整系数进行两次判断,可以有效的保证算法的鲁棒性。本发明方法能够有效地对当前场景的复杂度进行分析,识别当前场景所需动态范围,从而控制摄像机进行宽动态与非宽动态之间的模式切换。
-
公开(公告)号:CN108122031B
公开(公告)日:2020-12-15
申请号:CN201711379852.6
申请日:2017-12-20
Applicant: 杭州国芯科技股份有限公司
IPC: G06N3/063
Abstract: 本发明涉及一种低功耗的神经网络加速器架构。现有技术功耗高、启动慢,数据吞吐量大。本发明包括CPU、神经网络加速模块、只读存储模块、内部可读写随机存储器、外部可读写随机存储器、可读写非易失性存储器、电源管理模块、两个电源域。神经网络加速模块,用于对神经网络的命令进行硬件加速,并支持权重拆分和按结构拆分的神经网络;只读存储模块,用于存储固化的神经网络权重参数和结构参数;内部可读写随机存储器为SRAM,外部可读写随机存储器为DRAM;两个电源域分为高频开启电源域A和低频开启电源域B。本发明升级过程中不需要更换所有掩膜,只需要更改其中一层掩膜,大幅降低了升级成本。
-
-
-
-
-
-
-
-
-