-
公开(公告)号:CN119538997A
公开(公告)日:2025-02-28
申请号:CN202411575013.1
申请日:2024-11-06
Applicant: 南京大学
Abstract: 本发明涉及深度学习加速的技术领域,公开了一种基于异构SoC的混合精度DNN性能成本模型构建系统,获取不同数据量从低精度到高精度和从高精度到低精度精度转换的时间和功耗,量化执行所述精度转换的时间,分析精度转换对计算流水线的执行开销和数据搬运开销,通过构建混合精度执行成本模型量化不同映射计划在异构SoC上的执行时间、功耗、层间切换开销和精度转换开销来构建系统,通过该系统进行层配置和统计信息决定每层的计算精度,估计不同环境条件下的功耗和执行时间,模拟在不同温度条件下系统的功耗和性能表,并实施实时监控机制来检测温度变化,实现的系统具有更高的能效,适用于能源敏感的应用场景。
-
公开(公告)号:CN120046662A
公开(公告)日:2025-05-27
申请号:CN202510139595.7
申请日:2025-02-08
Applicant: 南京大学
IPC: G06N3/049 , G06N3/0464 , G06N3/045 , G06N3/063 , G06N3/08
Abstract: 本发明公开了一种可重构混合神经网络计算方法及装置,属于神经网络技术领域,其技术方案要点是包括,多个顺序设置的脉冲计算单元,每个脉冲计算单元的第一输入包括第一数据和第二数据中的一个,第一数据为待卷积数据的其中一个比特位数据,第二数据为一时间步长的脉冲数据,相邻的上一个脉冲计算单元的输出膜电压作为相邻的下一个脉冲计算单元的第二输入;每个脉冲计算单元响应于当前所有输入的第一数据,得到当前推理结果和输出膜电压;乘累加单元,乘累加单元响应于当前时间步长的第二数据,与每个脉冲计算单元共同基于第一输入和第二输入,得到输出膜电压和输出脉冲,本发明同时支持脉冲神经网络和人工神经网络的计算,且不消耗额外硬件资源。
-
公开(公告)号:CN119558360A
公开(公告)日:2025-03-04
申请号:CN202411607181.4
申请日:2024-11-12
Applicant: 南京大学
IPC: G06N3/049 , G06N3/0464 , G06N3/063
Abstract: 本发明涉及神经网络技术领域,是一种基于四进制脉冲的脉冲神经网络加速器及其计算方法,具体方法包括:构建神经元模型,预设三个膜阈值,根据神经元实时膜电位和三个膜阈值进行四进制脉冲生成触发判断,同时在四进制脉冲生成过程中执行零跳过策略,筛选获得有效四进制脉冲;当所述神经元模型中的神经元生成并发放有效四进制脉冲完成后,通过膜电位重置策略对神经元的膜电位进行重置处理;同步使用带有四进制脉冲的输入数据对带有四进制脉冲的深度残差脉冲神经网络进行训练,并通过额外的加法器生成最终的输出膜电位和四进制脉冲;本发明显著缩短了SNN的处理时间窗口,提高了计算效率和能效,适用于各种神经网络计算任务。
-
公开(公告)号:CN119132248A
公开(公告)日:2024-12-13
申请号:CN202411527796.6
申请日:2024-10-30
Applicant: 南京大学
IPC: G09G3/34 , G06T3/04 , G06T5/60 , G06T5/70 , G06T5/20 , G06T3/4007 , G06T3/4046 , G06T1/20 , G06F5/06 , G06N3/0464 , G06N3/0455
Abstract: 本发明公开了一种显示器件的动态背光调控方法及系统,包括:根据当前待显示的原始输入图像中每个像素点的特征值,形成灰度图像;将灰度图像输入至预设的卷积神经网络编码器模型,得到压缩特征图;将压缩特征图输入至预设的耦合扩散算法解码器模型,得到更新图像;基于更新图像每个像素点的灰度值,调控所述显示器的背光;本发明采用神经网络方法来进行图像背光的压缩特征提取,提升了算法对不同显示场景的适应性,在解码器阶段通过双线性插值和最近邻插值的耦合,使得扩充阶段的运算不过于复杂,又提供了相对更加可靠、平滑的图像效果,对于视频流的处理采用了乒乓设计和流水线架构设计,增加了并行度和数据吞吐率,提高了数据处理效率。
-
-
-