-
公开(公告)号:CN119917774A
公开(公告)日:2025-05-02
申请号:CN202411988401.2
申请日:2024-12-31
Applicant: 南京大学
IPC: G06F17/15
Abstract: 本申请提供一种面向大语言模型的非线性函数计算方法,包括获取初始近似参数配置;将初始近似参数配置输入至量化配置模型,得到目标优化参数配置;量化配置模型用于根据初始近似参数配置进行函数逼近计算,得到优化参数配置;根据基于优化参数配置统一配置处理后的所有基础非线性函数进行函数逼近计算,得到激活函数初始配置;利用激活函数初始配置以及所有逼近计算的基础非线性函数替换大语言模型中的基础非线性函数,得到目标优化参数配置;根据目标优化参数配置选取函数模块,利用目标优化参数配置对函数模块进行模块配置,并利用函数模块对非线性函数进行计算。本申请通过上述方法解决了非线性函数计算周期长、硬件资源开销大的问题。
-
公开(公告)号:CN115115018B
公开(公告)日:2025-04-01
申请号:CN202110295873.X
申请日:2021-03-19
Applicant: 南京大学
IPC: G06N3/082 , G06N3/063 , G06N3/049 , G06N3/0442
Abstract: 本申请提供一种用于长短记忆神经网络的加速系统,所述加速系统包括主机以及与所述主机实现数据交互的加速装置。所述加速装置包括:含有多个计算通道的通道组,与所述通道组相连接的权重缓存区、偏置缓存区以及激活缓存区,除此之外,加速装置还包括控制器以及解码组件。本申请中,主机用于对权重数据进行预处理获得第一输入数据,该第一输入数据为多组参数数量均衡的权重数据的集合。权重缓存区用于接收第一输入数据,该第一输入数据经解码组件解码后即可用于计算。将多组参数数量均衡的权重数据分别分配给不同处理单元进行计算,使得不同处理单元处理时间基本一致,从而解决随机稀疏带来的硬件负载不均衡问题。
-
公开(公告)号:CN119399578A
公开(公告)日:2025-02-07
申请号:CN202411428100.4
申请日:2024-10-12
Applicant: 南京大学
IPC: G06V10/774 , G06V10/82 , G06V10/10 , G06N3/0464 , G06N3/09 , G06N3/084 , G06N3/082
Abstract: 本申请提供一种点云数据稀疏卷积训练方法及系统,所述方法包括:获取待训练的点云数据;对所述点云数据进行预处理操作,得到目标卷积层;将所述目标卷积层拆解为卷积层组;所述卷积层组包括:若干个尺寸小于所述目标卷积层的卷积层;提取所述卷积层组的特征;将所述特征进行归一化处理,得到所述特征对应的数值以及阈值;利用所述阈值,对所述数值进行筛选,得到目标数值;基于所述目标数值,得到目标特征,以解决目前对于点云数据进行特征提取时,点云数据的稀疏性会消失,导致点云数据的计算量十分庞大,大幅增加了模型的训练时长和大小,同时提升了过拟合的风险的问题。
-
公开(公告)号:CN119276273A
公开(公告)日:2025-01-07
申请号:CN202411411824.8
申请日:2024-10-10
Applicant: 南京大学
Abstract: 本申请提供一种LDPC译码器、译码方法及电子设备,所述方法获取码字的信道消息以及索引值,并基于索引值对信道消息循环移位;再生成第一反馈信息,第一反馈信息为从变量节点到检查节点的反馈信息;根据第一反馈信息,生成第二反馈信息,第二反馈信息为从检查节点到变量节点的,并经压缩的反馈信息;生成第三反馈信息,第三反馈信息为更新后的信道消息,根据第三反馈信息生成译码结果;对译码结果执行奇偶校验,以输出奇偶校验结果,如果奇偶校验结果为低电平,输出译码结果。所述方法通过使用不同译码配置能够适应多码率和码长的变化,并且简化了译码过程,可兼容不同的应用,以解决LDPC译码器的灵活性低的问题。
-
公开(公告)号:CN118473535A
公开(公告)日:2024-08-09
申请号:CN202410367292.6
申请日:2024-03-28
Applicant: 南京大学
Abstract: 本申请提供一种深空光通信信号处理系统及单光子探测器,所述系统包括:通信连接的接收模块、分帧模块、滤波模块、生成模块;接收模块被配置为:接收单光子调制信号;分帧模块被配置为:获取接收模块发送的单光子调制信号,对单光子调制信号执行分帧操作,得到分帧数据;滤波模块被配置为:获取分帧模块发送的分帧数据,对分帧数据进行匹配滤波与维纳滤波处理,得到单光子调制信号不同时刻的光子数信息;生成模块被配置为:基于单光子调制信号不同时刻的光子数信息,经过光子数计算,生成解调以及译码参考结果,以解决目前的深空光通信接收端很难灵敏的利用到每一个单光子信号,导致后续通过单光子信号得到的解调译码结果准确性较低的问题。
-
公开(公告)号:CN118350455A
公开(公告)日:2024-07-16
申请号:CN202410275577.7
申请日:2024-03-12
Applicant: 南京大学
Abstract: 本申请提供一种重编译系统及神经网络推理加速器,所述重编译系统包括:接收模块,接收模块被配置为接收串行指令;重分配模块,重分配模块被配置为基于串行指令获取串行指令在静态存储器中的占用情况,判断是否存在空闲的静态存储器端口,若是,则将串行指令分配至空闲的静态存储器端口中,生成端口重分配指令;并发模块,并发模块被配置为基于端口重分配指令,获取端口重分配指令的指令并发形式,生成并发指令;确定模块,确定模块被配置为将并发指令输入至硬件仿真器或硬件平台上运行,根据预设任务信息确定目标并发指令,以解决目前的神经网络推理加速器中多模块的同步工作对算子开发人员极不友好,存在端口冲突、数据竞争冒险的问题。
-
-
公开(公告)号:CN113486298B
公开(公告)日:2023-10-17
申请号:CN202110721961.1
申请日:2021-06-28
Applicant: 南京大学
IPC: G06F17/16 , G06N3/082 , G06N3/0495
Abstract: 本申请实施例公开了基于Transformer神经网络的模型压缩方法、矩阵乘法模块,在该方法中,根据预设的第一参数,对原始权重矩阵中的每行权重进行分组,得到多个权重组,然后根据预设的第二参数,对每个权重组进行剪枝,最后获取非零权重矩阵以及二进制掩膜。该方法将权重的每行分为多组,各个权重组的非零元素数量一致,后续在计算流程中,并行计算的非零权重矩阵能够保持相同的计算时间,以此达到负载均衡的目的,具有较好的加速效果。
-
公开(公告)号:CN116483774A
公开(公告)日:2023-07-25
申请号:CN202310441735.7
申请日:2023-04-23
Applicant: 南京大学
Abstract: 本发明提供的一种兼容脉动阵列加速器的矢量处理器及处理方法,加入了脉动阵列加速器,并基于RISC‑V开源指令集自定义设计了专门的矢量指令调用脉动阵列加速器,用于实现矢量与矢量之间的计算。相比于原有的采用算术逻辑单元每个周期只能进行单个固定宽度的数据进行计算,脉动阵列加速器充分利用了原架构上的存储单元,增大了数据吞吐量,实现较多矢量数据的之间的计算,使得脉动阵列加速器的加速效果得到充分利用,计算利用率得到大幅提高。脉动阵列加速器可以支持多精度及超低比特量化计算,提高矢量计算的效率,同时矢量处理器的并行性和可拓展性可以极大地提高数据计算密度,从而实现算力的有效提升。
-
公开(公告)号:CN116415641A
公开(公告)日:2023-07-11
申请号:CN202310411784.6
申请日:2023-04-17
Applicant: 南京大学
IPC: G06N3/063 , G06N3/0464 , G06F16/22 , G06F17/16
Abstract: 本申请提供了一种基于神经网络的点云数据的处理方法和系统,能够提升对点云数据的处理速度。该方法包括:获取神经网络的权重矩阵;根据权重矩阵的尺寸,确定索引矩阵的尺寸;根据待处理的点云数据中至少一个零值激活位点的位置,以及点云数据中至少一个非零激活位点的位置,确定索引矩阵的内容,索引矩阵包括的每一索引值用于表示点云数据中相应位置的位点的数值是否为零;根据至少一个非零激活位点的位置以及权重矩阵的尺寸,对至少一个非零激活位点重新排列,确定激活值矩阵;根据索引矩阵、激活值矩阵和权重矩阵确定至少一个配对组,每一配对包括非零激活位点和权重值;通过神经网络对至少一个配对组进行卷积运算,获取对点云数据的处理结果。
-
-
-
-
-
-
-
-
-