-
公开(公告)号:CN117311663A
公开(公告)日:2023-12-29
申请号:CN202311305768.5
申请日:2023-10-10
Applicant: 南京大学
IPC: G06F7/498 , G06N3/063 , G06N3/0464 , G06N3/045 , G06N3/0475 , G06N3/094
Abstract: 本发明公开了一种基于神经网络激活分布的可重构近似乘累加单元,具体包括乘法模块,包括:编码器,将神经网络的激活输入和权重输入进行radix‑8 booth编码,生成对应的部分积选择信号;部分积生成器,根据部分积选择信号,生成部分积;第一加法器,将部分积按照从上到下的顺序进行累加,得到乘法结果;加法模块,包括:分类器,根据所述乘法结果的高位进行分类,分为大数和小数;压缩器,将大数进行精确压缩,将小数进行近似压缩;第二加法器,将压缩结果通过第二加法器相加,得到卷积结果。本发明在不损失太多精度的前提下有效地减少神经网络中计算单元的功耗和延时,并且能够动态的适应不同的网络类型,有着良好的实际应用价值。
-
公开(公告)号:CN119474000A
公开(公告)日:2025-02-18
申请号:CN202411507882.0
申请日:2024-10-28
Applicant: 南京大学
IPC: G06F15/78 , G06F15/173 , G06F7/544 , G06N3/063 , G06N3/0464
Abstract: 本发明涉及近似片上网络技术领域,公开了一种面向卷积神经网络加速的高实时性近似片上网络,结合神经网络的数据分布情况,提出基于数据分级的近似压缩和分段恢复方案,实现在降低通信开销的同时,保持神经网络推理精度;并提出一个质量控制模型,该模型能够快速搜索出满足质量损失约束的神经网络各层阈值,确保网络在进行近似通信的同时保持准确性;进一步提出基于拥塞感知的阈值动态调整方案,通过感知网络中的拥塞情况,动态调整每一层的近似阈值,以实现对数据压缩率的实时优化,从而有效缓解通信网络中的拥塞问题;结合近似通信后网络中的激活数据分布特征,优化计算阵列中的近似计算模块,提升计算阵列的整体效率,实现计算加速。
-