-
公开(公告)号:CN119740629A
公开(公告)日:2025-04-01
申请号:CN202411819313.X
申请日:2024-12-11
Applicant: 电子科技大学
Abstract: 本发明属于深度学习的技术领域,具体提供了一种新的深度强化学习方法,名为DCCP(Dynamic Clipping Proximal Policy),用于改善当前的深度强化学习算法对于某些策略控制任务无法有效地控制策略收敛的问题。本方法主要通过使用自适应的动态裁剪率和优化的损失函数表达式,起到策略收敛的效果。本方法能够防止深度强化学习神经网络提前收敛于局部最小值,鼓励策略进行积极的探索,并且在数据分布稀疏的场景,能很好地收敛。
-
公开(公告)号:CN119761434A
公开(公告)日:2025-04-04
申请号:CN202411806772.4
申请日:2024-12-10
Applicant: 电子科技大学
Abstract: 本发明涉及人工智能的神经网络推理计算领域,提供一种神经网络矩阵乘法加速器及其部署方法,旨在提高人工智能神经网络推理计算领域的计算效率。该加速器基于脉动阵列设计,包括脉动阵列计算模块、控制指令链模块和统一缓存及内存读写模块。本发明还提供了脉动阵列中改进处理单元(Process Element,PE)的控制寄存器配置值的计算方法、重排序模块的排序配置项计算方案以及加速器的调度方案。该加速器具有通用性,能够在同一硬件结构下进行任意掩码的矩阵乘法运算,并有效利用FPGA的高并发特性,减少计算时间,提高能效比。
-