-
公开(公告)号:CN116149172A
公开(公告)日:2023-05-23
申请号:CN202211445186.2
申请日:2022-11-18
Applicant: 广东工业大学 , 佛山芯珠微电子有限公司
IPC: G05B13/04
Abstract: 本发明公开了一种基于深度学习和北斗系统的自动驾驶汽车速度控制方法,首先由北斗卫星定位系统实时采集汽车的位置信息,自动驾驶汽车根据位置信息和环境感知设定参考速度,接着构建自动驾驶汽车的速度控制模型,对速度控制模型进行模型预测控制方法求解,并收集所述求解过程中的数据;然后建立深度神经网络模型,用收集的数据对该深度神经网络进行训练,最后得到一个DNN控制器代替MPC控制器实现控制变量的最优化求解。本发明实现了与模型预测控制方法几乎相同的控制性能,并且在控制时间上大大缩减,满足了自动驾驶汽车射胶速度控制的实时性要求,得到了具有在线调参,控制精度高,抗干扰性强,实时性等优点的自动驾驶汽车射胶速度控制模型。
-
公开(公告)号:CN117973471A
公开(公告)日:2024-05-03
申请号:CN202410149411.0
申请日:2024-02-02
Applicant: 广东工业大学
IPC: G06N3/063 , G06N3/0464 , G06N3/048 , G06N3/084 , G06V10/764 , G06V10/82 , G06V10/44
Abstract: 本发明公开了一种基于深度学习的AI加速器量化算法,该方法包括获取预训练模型的各项参数,对权重的输入激活值进行限制和映射,得到输入激活的位宽;对预训练模型的浮点数数据进行预处理;基于输入激活的位宽对第一张量进行分组量化;对分组量化数据进行绝对值累加,并计算原始数据与分组量化数据的绝对值累加值的误差;设置超参数空间,并调整超参数组合;基于不同超参数组合和绝对值累加值的误差筛选分组量化数据;对预训练模型进行训练,并使损失函数最小化,得到最优的比特位权值分布及其对应的分组量化数据。通过使用本发明能够在保持精度的前提下,灵活地将每一层的数据量化为合适的量化位宽。本发明可广泛应用于人工智能技术领域。
-
公开(公告)号:CN113138748A
公开(公告)日:2021-07-20
申请号:CN202110382102.4
申请日:2021-04-09
Applicant: 广东工业大学
Abstract: 本发明公开了一种基于FPGA的支持8bit和16bit数据位宽的可配置的CNN乘法累加器,包括控制模块、输入特征图寄存器、权重寄存器、部分和寄存器、PE阵列以及输出特征图寄存器,其中:所述控制模块用于控制整个卷积计算的时序;输入特征图寄存器用于寄存输入特征图,并把输入特征图像素按照卷积顺序输出到PE阵列;权重寄存器用于为PE阵列提供输入权重;部分和寄存器是一个只有一层的寄存器阵列,PE阵列用于完成卷积计算,输出特征图寄存器用于寄存通过PE阵列完成计算后的值。本发明能加快CNN硬件加速器的设计与部署,简化设计流程。
-
公开(公告)号:CN110493003A
公开(公告)日:2019-11-22
申请号:CN201910548928.6
申请日:2019-06-24
Applicant: 广东工业大学
Abstract: 本发明公开了一种基于四基二进制底层模运算的快速加密系统,包括用于实现系统的签名验签和加解密功能的协议层,以及用于实现曲线域算术和素数域模运算的运算层,其中:所述的运算层包括标量乘模块,标量乘模块上连接有用于进行杂凑运算的SM3模块、用于产生随机数的随机数发生器,标量乘模块包括点加模块和倍点模块,用于实现模逆、模乘和模加减运算;本方案通过改进椭圆曲线加密系统的底层模运算,实现了基于四基二进制底层模运算的快速加密系统,本专利的主要创新点在于将四基二进制快速模运算引入椭圆曲线加密系统,进而提升加密系统的运算效率。
-
公开(公告)号:CN116882451A
公开(公告)日:2023-10-13
申请号:CN202310581561.4
申请日:2023-05-23
Applicant: 广东工业大学
IPC: G06N3/0464 , G06N3/092 , G06N3/063
Abstract: 本发明的目的在于提供一种基于强化学习的CNN加速器架构优化方法、装置及存储介质,包括:根据硬件资源,选择基于价值的强化学习作为设计空间的主体框架,并利用强化学习来近似最优动作价值函数给动作进行打分;智能体根据不同动作的分数,选择最高分数的一个动作作为这一时刻的动作;同时,环境根据这一动作来更新状态和给出该动作对应的奖励;强化学习通过奖励来更新模型的参数,直到选择的动作评分即各类模块的分置和资源调度使得奖励的总和即回报达到最大;本发明所述的方法,能够解决其他强化学习方法效率低下的问题,使得基于强化学习的设计空间算法在效率上有了很大的提升,带来了加速器架构优化效果的提升。
-
公开(公告)号:CN116596049A
公开(公告)日:2023-08-15
申请号:CN202310425167.1
申请日:2023-04-20
Applicant: 广东工业大学
IPC: G06N3/063 , G06N3/0464 , G06N3/092
Abstract: 本发明的目的在于提供一种基于强化学习的AI处理器架构优化方法、装置及存储介质,包括:通过卷积神经网络和硬件平台构成AI处理器评估模型,并在所述AI处理器评估模型中获取能够得到最大回报的行动的函数;设置经验回放缓存池,将采样得到的样本保存在缓存池内;在收集到足够的样本时,通过所述取能够得到最大回报的行动的函数与神经网络构建策略函数,并利用增加高斯噪声干扰所述策略函数,从所述经验回放缓存池内获取训练样本;训练所述策略函数,并通过所述策略函数获取最大奖励,得到优化后的AI处理器架构的参数。本发明所述的方法可以获得更好的样本利用率、稳定性和探索能力,并且能够得到最佳的AI处理器架构设计参数。
-
公开(公告)号:CN110493003B
公开(公告)日:2021-08-17
申请号:CN201910548928.6
申请日:2019-06-24
Applicant: 广东工业大学
Abstract: 本发明公开了一种基于四基二进制底层模运算的快速加密系统,包括用于实现系统的签名验签和加解密功能的协议层,以及用于实现曲线域算术和素数域模运算的运算层,其中:所述的运算层包括标量乘模块,标量乘模块上连接有用于进行杂凑运算的SM3模块、用于产生随机数的随机数发生器,标量乘模块包括点加模块和倍点模块,用于实现模逆、模乘和模加减运算;本方案通过改进椭圆曲线加密系统的底层模运算,实现了基于四基二进制底层模运算的快速加密系统,本专利的主要创新点在于将四基二进制快速模运算引入椭圆曲线加密系统,进而提升加密系统的运算效率。
-
公开(公告)号:CN110569204A
公开(公告)日:2019-12-13
申请号:CN201910666661.0
申请日:2019-07-23
Applicant: 广东工业大学
IPC: G06F12/0875 , G06F12/0897 , G06F12/128
Abstract: 本发明公开了一种基于FPGA和DDR3SDRAM的可配置图像数据缓存系统,包括外部存储模块、存储控制模块、第一缓存模块、第二缓存模块以及缓存控制模块,视频图像数据和时钟信号从缓存控制模块写入到第一缓存模块进行第一级缓存;存储控制模块再控制从第一缓存模块读取数据储存到外部存储模块;然后存储控制模块控制从外部存储模块读出储存的数据,写入到第二缓存模块进行第二级缓存;接着,缓存控制模块控制从第二缓存模块读取出数据到缓存控制模块,缓存控制模块将图像数据进行调整并产生对应的读有效信号,将这些配置数据输出给外界。本发明可以缓存更大的数据传输,达到数据传输的实时性、稳定性的效果;封装后的系统只有少许的端口,配置更加便捷。
-
公开(公告)号:CN110569204B
公开(公告)日:2023-01-20
申请号:CN201910666661.0
申请日:2019-07-23
Applicant: 广东工业大学
IPC: G06F12/0875 , G06F12/0897 , G06F12/128
Abstract: 本发明公开了一种基于FPGA和DDR3SDRAM的可配置图像数据缓存系统,包括外部存储模块、存储控制模块、第一缓存模块、第二缓存模块以及缓存控制模块,视频图像数据和时钟信号从缓存控制模块写入到第一缓存模块进行第一级缓存;存储控制模块再控制从第一缓存模块读取数据储存到外部存储模块;然后存储控制模块控制从外部存储模块读出储存的数据,写入到第二缓存模块进行第二级缓存;接着,缓存控制模块控制从第二缓存模块读取出数据到缓存控制模块,缓存控制模块将图像数据进行调整并产生对应的读有效信号,将这些配置数据输出给外界。本发明可以缓存更大的数据传输,达到数据传输的实时性、稳定性的效果;封装后的系统只有少许的端口,配置更加便捷。
-
公开(公告)号:CN110619347A
公开(公告)日:2019-12-27
申请号:CN201910703906.2
申请日:2019-07-31
Applicant: 广东工业大学
IPC: G06K9/62 , G06N3/04 , G06N3/08 , G06F16/951
Abstract: 本发明公开了一种基于机器学习的图像生成方法,包括以下步骤:S1:获取图像数据及数据预处理;S2:网络模型构建;S3:训练网络模型;S4:生成与用户输入图像的特征信息相匹配的图像。其中,在生成模型(类似变分自编码器中的解码器)后面加入一个判别模型,判别模型用于判别生成的样本与训练数据中样本的相似度。通过对该神经网络模型进行一系列的训练后,使得判别器已无法判别生成器生成的图像是否来自真实数据,从而达到生成器生成的图像即人们所需要的图像。
-
-
-
-
-
-
-
-
-