-
公开(公告)号:CN117472800A
公开(公告)日:2024-01-30
申请号:CN202311472456.3
申请日:2023-11-07
Applicant: 广东工业大学
IPC: G06F12/0875 , G06F5/08 , G06N3/063 , G06N3/0464
Abstract: 本发明公开了一种针对卷积神经网络的高效硬件缓存电路,该电路包括:数据缓存模块,将DDR中的数据存储至片上的BRAM中;数据移位模块,读取数据缓存模块中BRAM的数据,进行移位操作;异步传输模块,将数据移位模块移位后的数据进行异步,将其中的FIFO用于存放数据,等待调用。通过使用本发明,能够克服基于FPGA的卷积神经网络加速器的输入特征图无法高效缓存的问题,在减少资源的使用的同时,降低电路设计的复杂度。本发明可广泛应用于芯片领域。
-
公开(公告)号:CN108243002A
公开(公告)日:2018-07-03
申请号:CN201810026230.3
申请日:2018-01-11
Applicant: 广东工业大学
IPC: H04L9/30
Abstract: 本发明公开了一种模约减方法、装置、设备及计算机可读存储介质,本发明将第一操作数加0补足至512位并得到第二操作数,将第二操作数通过约减算法计算得到第一最终值,然后将第一最终值加0补足至288位并得到第三操作数,将第三操作数通过约减算法计算得到第二最终值,判断第二最终值是否小于预设阈值,若是,则输出第二最终值;若否,则将第二最终值减去预设阈值得到第三最终值并输出第三最终值。本发明经过两次约减算法后输出的结果只需要减一次或者不用减去SM2加密算法中规定的可操作数值范围的最大值,相比现有技术中需要减很多次该最大值,本发明大大减少了减去该最大值的次数,缩短了计算时间,提高了模约减的速度。
-
公开(公告)号:CN106653034A
公开(公告)日:2017-05-10
申请号:CN201611123123.X
申请日:2016-12-08
Applicant: 广东工业大学
CPC classification number: H04W12/02 , G10L19/0018 , H04M1/7255
Abstract: 本发明实施例公开了一种用于移动终端的语音通信系统和方法,该系统包括:语音采集器,用于采集用户的通信语音;编码器,用于对语音采集器采集的通信语音进行编码压缩;SM4加密组件,用于通过SM4加密算法对经编码器编码压缩后的通信语音进行语音加密;语音传输组件,用于对经过语音加密的通信语音进行通信传输;SM4解密组件,用于获取语音传输组件传输的通信语音,并通过SM4解密算法进行相应地语音解密;解码器,用于对经过SM4解密组件语音解密后的通信语音进行解码还原;语音播放器,用于对经过解码器解码还原的通信语音进行播放。采用SM4加解密算法直接对通信语音的信息进行加解密,既实现了安全通信,又降低了通信的延迟。
-
公开(公告)号:CN117973471A
公开(公告)日:2024-05-03
申请号:CN202410149411.0
申请日:2024-02-02
Applicant: 广东工业大学
IPC: G06N3/063 , G06N3/0464 , G06N3/048 , G06N3/084 , G06V10/764 , G06V10/82 , G06V10/44
Abstract: 本发明公开了一种基于深度学习的AI加速器量化算法,该方法包括获取预训练模型的各项参数,对权重的输入激活值进行限制和映射,得到输入激活的位宽;对预训练模型的浮点数数据进行预处理;基于输入激活的位宽对第一张量进行分组量化;对分组量化数据进行绝对值累加,并计算原始数据与分组量化数据的绝对值累加值的误差;设置超参数空间,并调整超参数组合;基于不同超参数组合和绝对值累加值的误差筛选分组量化数据;对预训练模型进行训练,并使损失函数最小化,得到最优的比特位权值分布及其对应的分组量化数据。通过使用本发明能够在保持精度的前提下,灵活地将每一层的数据量化为合适的量化位宽。本发明可广泛应用于人工智能技术领域。
-
公开(公告)号:CN113138748A
公开(公告)日:2021-07-20
申请号:CN202110382102.4
申请日:2021-04-09
Applicant: 广东工业大学
Abstract: 本发明公开了一种基于FPGA的支持8bit和16bit数据位宽的可配置的CNN乘法累加器,包括控制模块、输入特征图寄存器、权重寄存器、部分和寄存器、PE阵列以及输出特征图寄存器,其中:所述控制模块用于控制整个卷积计算的时序;输入特征图寄存器用于寄存输入特征图,并把输入特征图像素按照卷积顺序输出到PE阵列;权重寄存器用于为PE阵列提供输入权重;部分和寄存器是一个只有一层的寄存器阵列,PE阵列用于完成卷积计算,输出特征图寄存器用于寄存通过PE阵列完成计算后的值。本发明能加快CNN硬件加速器的设计与部署,简化设计流程。
-
公开(公告)号:CN109214195A
公开(公告)日:2019-01-15
申请号:CN201810835995.1
申请日:2018-07-26
Applicant: 广东工业大学
Abstract: 本发明涉及一种抗差分功耗攻击的SM2椭圆曲线签名验签硬件系统及方法,本发明中的抗差分功耗攻击方法运用到标量乘法里,通过将改进的随机化标量方法加入到点乘运算里,破坏了真实密钥信息和功耗曲线之间的相关性,给功耗分析获取信息带来很大难度达到抵御功耗分析的目的,保证了对差分功耗攻击的安全性,从而起到很好的抗差分功耗攻击作用;而且这种方法简单易行,同时可以集成到多种加密芯片等硬件设备上。
-
公开(公告)号:CN118396060A
公开(公告)日:2024-07-26
申请号:CN202410460615.6
申请日:2024-04-17
Applicant: 广东工业大学
IPC: G06N3/063 , G06N3/0464 , G06N3/0495 , G06N3/048
Abstract: 本发明公开了一种基于混合比特位宽的稀疏卷积加速器,该稀疏卷积加速器包括:总控模块,用于控制所述基于混合比特位宽的稀疏卷积加速器的整体运行;DMA,用于执行片内外图像数据和权重的搬运;第一计算核,用于完成混合比特位宽的稀疏卷积层的加速;缓存模块,用于缓存和复用数据。本发明提出了一种以低位宽乘法器为基本单元,通过加法、移位及基本单元的灵活组合,以支持混合精度计算的CNN乘法累加器结构,灵活、高效地实现对不同压缩网络模型的卷积算子的硬件加速。本发明可广泛应用于芯片设计领域。
-
公开(公告)号:CN109102065B
公开(公告)日:2022-03-11
申请号:CN201810689938.7
申请日:2018-06-28
Applicant: 广东工业大学 , 佛山芯珠微电子有限公司
Abstract: 本专利公开了一种基于PSoC器件构建的卷积神经网络加速器,包括片外存储器、CPU、特征图输入存储器、特征图输出存储器、偏置存储器、权重存储器、直接内存存取与神经元数目相同的计算单元,所述计算单元包括先入先出队列、状态机、数据选择器、平均值池化模块、最大值池化模块、乘加计算模块、激活函数模块,所构成的乘加计算模块内计算是并行执行的,可用于多种架构的卷积神经网络系统。本发明充分利用片上可编程系统(PSoC,Programmable System on Chip)器件中可编程部分实现计算量大,并行性高的卷积神经网络计算部分,利用CPU实现串行算法及状态控制。
-
公开(公告)号:CN109040067B
公开(公告)日:2020-12-11
申请号:CN201810872171.1
申请日:2018-08-02
Applicant: 广东工业大学 , 佛山芯珠微电子有限公司
Abstract: 本发明公开了一种基于物理不可克隆技术PUF的用户认证设备,包括物理不可克隆模块PUF、认证模块、认证控制模块、随机数发生器和计数器,其中:所述物理不可克隆模块PUF嵌入在认证设备中用于产生认证相关的密钥对;所述认证模块嵌入非对称算法以及摘要算法来完成认证需要执行的运算;用户通过所述认证控制模块可手动控制发送认证请求以及发送认证信息;本发明基于简单易用、隐私安全以及兼容通用这三大原则,满足简单易用、高安全以及能够兼容多个网络服务器的需求,该设备内部芯片采用不可克隆技术PUF能够保障了设备的唯一性,满足设备不可克隆复制、隐私安全的特性。
-
公开(公告)号:CN109040067A
公开(公告)日:2018-12-18
申请号:CN201810872171.1
申请日:2018-08-02
Applicant: 广东工业大学 , 佛山芯珠微电子有限公司
CPC classification number: H04L9/3278 , H04L9/3066 , H04L63/0442
Abstract: 本发明公开了一种基于物理不可克隆技术PUF的用户认证设备,包括物理不可克隆模块PUF、认证模块、认证控制模块、随机数发生器和计数器,其中:所述物理不可克隆模块PUF嵌入在认证设备中用于产生认证相关的密钥对;所述认证模块嵌入非对称算法以及摘要算法来完成认证需要执行的运算;用户通过所述认证控制模块可手动控制发送认证请求以及发送认证信息;本发明基于简单易用、隐私安全以及兼容通用这三大原则,满足简单易用、高安全以及能够兼容多个网络服务器的需求,该设备内部芯片采用不可克隆技术PUF能够保障了设备的唯一性,满足设备不可克隆复制、隐私安全的特性。
-
-
-
-
-
-
-
-
-