-
公开(公告)号:CN119577623A
公开(公告)日:2025-03-07
申请号:CN202510119819.8
申请日:2025-01-25
Applicant: 南京大学
Abstract: 本发明公开了一种基于多级复用算法的超轻量化癫痫监测方法及系统,属于卷积神经网络技术领域,其技术方案要点是,获取当前t时刻的脑电波样本数据、t‑kn时刻的脑电波样本推理结果和t‑k时刻的图卷积结果数据,其中每个时刻的脑电波采样长度均为m×k×n,k为采样步长,n、m和k均为正整数;提取t‑kn时刻的脑电波样本推理结果中与当前t时刻采样区间重叠的数据,得到第一数据,提取t‑k时刻的图卷积结果数据中,与当前t时刻采样区间重叠且与t‑kn时刻采样区间不重叠的数据,得到第二数据;根据第一数据和第二数据,得到t时刻的脑电波推理结果,本发明通过复用当前时刻之前的结果数据,减少了平均推理的计算量。
-
公开(公告)号:CN119474007A
公开(公告)日:2025-02-18
申请号:CN202411555390.9
申请日:2024-11-04
Applicant: 南京大学
Abstract: 本发明公开了可重构计算阵列、重构控制器架构、芯片及重构计算方法,包括主控模块、状态机模块、计算译码器模块、访存资源控制器模块、重构控制器模块、可重构计算阵列、输入缓冲区模块和输出缓冲区模块;状态机模块通过状态切换,控制整个重构计算过程;重构控制器模块根据计算译码器模块的译码结果配置可重构计算阵列中PE单元的连接方式,实现多种计算功能以完成不同类型的数据计算任务。本发明通过对可重构计算阵列中多个计算单元进行动态配置,使得硬件架构能够根据不同的算法需求进行实时调整,对可重构计算阵列进行精准配置以完成不同的计算任务,而无需为每种任务设计专用的硬件,从而提高芯片配置的灵活性并提高资源利用率。
-
公开(公告)号:CN113705803B
公开(公告)日:2024-05-28
申请号:CN202111011695.X
申请日:2021-08-31
Applicant: 南京大学
Abstract: 本发明涉及基于卷积神经网络的图像硬件识别系统及部署方法,基于SoC平台实现MobileNetV1 SSD网络进行图像识别,平台内置ARM处理器和FPGA。ARM端完成全局调度任务,主要完成数据预处理,数据重排,网络推理,FPGA配置,以及后处理,包括非极大值抑制算法实现。ARM端整体策略采用按通道取数的方式以及MEC策略来降低数据重复率。FPGA端设计数据分发模块配合特殊尺寸的SRAM进行数据缓存,1*1和3*3两种卷积控制器,其中3*3卷积可配置成dw卷积和normal卷积两种模式,PE乘法阵列、加法树阵列,以及通道累加模块,大大提高资源的利用率。ARM端和FPGA端的交互通过调用驱动函数ioctl来实现,映射到硬件的Avalon接口实现数据与配置信息传输。本发明在板子资源受限的情况下有较好的优化。
-
公开(公告)号:CN115277563B
公开(公告)日:2024-03-19
申请号:CN202210636087.6
申请日:2022-06-07
Applicant: 南京大学
IPC: H04L47/12 , H04L47/32 , H04L47/38 , H04L45/028
Abstract: 本发明公开了一种基于离线强化学习的片上网络近似控制系统。本发明采用离线强化学习算法,利用软硬件协同手段,在软件端训练,在硬件端部署;片上网络中设置全局近似控制器用来部署决策神经网络;其余节点利用局部数据控制器根据全局近似控制器的发送的信息调整数据近似率。本发明通过离线强化学习算法对决策网络进行训练,将训练完成的决策网络部署至硬件中,能在不同的应用条件下感知网络拥塞状态,动态调整数据近似率使得网络在传输质量和网络性能两者之间达到良好平衡。
-
公开(公告)号:CN112052941B
公开(公告)日:2024-02-20
申请号:CN202010947798.6
申请日:2020-09-10
Applicant: 南京大学
IPC: G06N3/0464 , G06N3/063 , G06F17/15 , H04L67/568
Abstract: 本发明提出了一种应用于CNN网络卷积层的高效存算系统及其运算方法,该架构包括:用于缓存结果数据的数据缓存模块;用于进行高并行全流水卷积运算,得到卷积运算结果的运算阵列;用于读取数据缓存中的图像源数据并发送给所述运算阵列的源数据分发模块;用于读取数据缓存中的权重数据,并将数据复制重新编组,发送给所述运算阵列的权重共享模块;用于将运算阵列卷积计算结果存入所述数据缓存模块中的结果数据写入模块。本发明提出的高效存算架构基于全流水的并行运算簇设计了运算阵列,并且设计与之匹配的数据缓存和高带宽供数通道,以较低的硬件复杂度,实现了CNN网络密集卷积算法的高性能运算,具有良好的应用前景。
-
公开(公告)号:CN113128675B
公开(公告)日:2023-12-26
申请号:CN202110431741.5
申请日:2021-04-21
Applicant: 南京大学
Abstract: 本发明提出一种基于脉冲神经网络的无乘法卷积调度器及其硬件实现方法,利用SNN基于事件驱动的特性,通过硬件来实现SNN中的卷积计算,为图像分割中的SNN提出了一种有效的卷积调度方法;该方法通过FIFO缓存输入的神经元状态,并送入“1”过滤器实现有效状态的过滤,避免无效状态参与计算,提高计算效率,且无需乘法计算;根据数据流特点,特殊考虑并行存储结构,使用较少的存储资源达到并行存储,以适配计算单元的高并行算力;计算过程中每个time step的结果原位存回,提高存储资源利用率;最终可实现基于脉冲神经网络任意规格输入的3×3卷积计算,支持64路并行计算;该方法提高了神经网络中卷积计算的性能,降低计算复杂度和功耗,同时具有较高灵活性。
-
公开(公告)号:CN113760660B
公开(公告)日:2023-08-11
申请号:CN202111043131.4
申请日:2021-09-07
Applicant: 南京大学
IPC: G06F11/30 , G06N3/0442
Abstract: 本发明提出了一种基于长短时记忆神经网络的三维多核芯片温度预测方法及系统,其中所述方法采用的模型通过长短时记忆神经网络层与全连接层相结合实现,其中长短时记忆神经网络层接收历史温度信息作为输入;全连接层输出多个时间长度后的预测温度信息。本发明提出的方法可为多核芯片中动态温度管理模型提供时间与空间的热分析:即预测节点的温度变化和三维多核芯片的温度分布。本发明通过神经网络对三维多核芯片中温度变化模式的学习能确定潜在热点的位置,较为准确地对每个节点进行多步长温度预测,从而便于动态温度管理模型对芯片整体温度分布情况的掌握,进一步提前进行温度调控,避免热点的产生。
-
公开(公告)号:CN110427960B
公开(公告)日:2023-04-25
申请号:CN201910528797.5
申请日:2019-06-18
Applicant: 南京大学
IPC: G06F18/2411
Abstract: 本发明涉及可重构多分类支持向量机系统,该系统包括:主控制模块,存储控制模块,核函数运算模块,类别运算模块和结果比较模块。所述主控制模块为整个决策过程提供控制信息和重构信息;所述的存储控制模块控制数据的存储;所述的核函数运算模块计算测试数据和支持向量之间的核函数;所述的类别运算模块计算决策值和分类类别;所述的结果比较模块比较不同模型计算得到的决策值,得到测试数据的最终分类结果。与传统方法相比,本发明充分利用硬件的并行性,加快了支持向量机分类的运算速度,核函数运算模块和类别运算模块共享计算资源,支持硬件可重构,对于不同特征数的样本具有很好的灵活性。
-
公开(公告)号:CN111027585B
公开(公告)日:2023-04-07
申请号:CN201911026337.9
申请日:2019-10-25
Applicant: 南京大学
IPC: G06F18/23213 , G06N20/10
Abstract: 本发明涉及一种基于k‑means++质心初始化的k‑means算法硬件实现方法及系统,包括主控制模块,为算法实现提供控制和重构信息;存储控制模块,控制数据传输和存储;质心初始化模块,基于k‑means++算法初始化质心;聚类运算模块,基于距离比较获得聚类结果;质心更新模块,通过各类别平均值计算更新质心;阈值比较模块,用于判断质心是否收敛。该硬件实现方法充分利用硬件的并行性,用k‑means++质心初始化方案替代随机质心初始化方案,提高算法收敛速度;采用硬件友好的距离计算方案;支持可重构,通过配置可重构计算阵列构建各模块运算单元;支持不同特征数的样本进行多类别聚类计算。
-
公开(公告)号:CN113612575B
公开(公告)日:2022-10-18
申请号:CN202110737035.3
申请日:2021-06-30
Applicant: 南京大学
Abstract: 本发明提出了一种面向Wimax协议的QC‑LDPC译码器译码方法及系统,基于提出的面向Wimax协议的QC‑LDPC译码器,利用存储的QC‑LDPC校验矩阵信息,简化了译码器的译码计算复杂度,同时节省了硬件计算资源。其中,译码过程采用基于Offset Min‑sum的行分层译码算法作为译码方法,使得硬件兼容性更广、且具备易于实现的优点。通过流水化设计,对校验矩阵信息读取、映射,实现了高效流水LDPC译码;最终可支持IEEE 802.16e通信协议下,1/2码率19种码长的LDPC译码运算;因此本发明具有硬件复杂度低,存储资源利用率高的特点,以及可实现高吞吐率LDPC译码运算。
-
-
-
-
-
-
-
-
-