-
公开(公告)号:CN119201036A
公开(公告)日:2024-12-27
申请号:CN202411237875.3
申请日:2024-09-04
Applicant: 南京大学
IPC: G06F7/544 , G06N3/0464 , G06N3/0455
Abstract: 本申请提供一种硬件友好的高精度浮点超越函数计算系统,系统包括参数获取模块,参数获取模块被配置为获取待计算的单精度浮点参数和计算函数选择信号;超越函数预处理模块,超越函数预处理模块被配置为对单精度浮点参数分别进行预处理,并输出目标预处理结果;计算模块,计算模块被配置为选取目标预处理结果,根据目标预处理结果进行计算,得到目标多项式计算结果;前导零检测模块,前导零检测模块被配置为对目标多项式计算结果进行前导零检测,得到检测结果;超越函数后处理模块,超越函数后处理模块被配置为对检测结果进行规范化处理,并输出对应超越函数的目标结果。本申请通过该系统解决了现有超越函数计算方案效率低下且计算周期长的问题。
-
公开(公告)号:CN119201230A
公开(公告)日:2024-12-27
申请号:CN202411240528.6
申请日:2024-09-04
Applicant: 南京大学
Abstract: 本申请提供一种适用于神经网络的可配多功能向量计算装置,包括存储控制模块,存储控制模块被配置为从神经网络中获取待计算数据,并将待计算数据存储在对应的寄存器中;操作码存储模块,操作码存储模块被配置为从神经网络中获取并存储若干个操作码;浮点计算模块,浮点计算模块被配置为根据操作码对待计算数据进行目标计算;目标计算包括基础计算、SRT计算和快速计算;状态机模块,状态机模块被配置为根据计算指令从操作码存储模块中选取对应的操作码以及从存储控制模块中选取对应的待计算数据,并将操作码和待计算数据发送给浮点计算模块进行对应操作码的目标计算。本申请通过上述计算装置解决了现有浮点计算技术灵活性差、通用性低的问题。
-
公开(公告)号:CN119917774A
公开(公告)日:2025-05-02
申请号:CN202411988401.2
申请日:2024-12-31
Applicant: 南京大学
IPC: G06F17/15
Abstract: 本申请提供一种面向大语言模型的非线性函数计算方法,包括获取初始近似参数配置;将初始近似参数配置输入至量化配置模型,得到目标优化参数配置;量化配置模型用于根据初始近似参数配置进行函数逼近计算,得到优化参数配置;根据基于优化参数配置统一配置处理后的所有基础非线性函数进行函数逼近计算,得到激活函数初始配置;利用激活函数初始配置以及所有逼近计算的基础非线性函数替换大语言模型中的基础非线性函数,得到目标优化参数配置;根据目标优化参数配置选取函数模块,利用目标优化参数配置对函数模块进行模块配置,并利用函数模块对非线性函数进行计算。本申请通过上述方法解决了非线性函数计算周期长、硬件资源开销大的问题。
-
公开(公告)号:CN119249050A
公开(公告)日:2025-01-03
申请号:CN202411309098.9
申请日:2024-09-19
Applicant: 南京大学
Abstract: 本申请提供一种基于系数查找表的非线性激活函数快速计算装置及方法,装置包括:输入选择单元,用于选择输入的浮点数;系数查找表单元,用于将激活函数全区域划分为若干区间,并将非无限区间划分成若干段;在每一段上使用二次函数进行逼近,以建立系数查找表;预处理单元,用于对浮点数进行特征提取,以得到符号位、阶码和尾数;运算单元,用于计算出索引值和第二尾数子段;根据索引值在系数查找表中获取对应二次函数系数;基于第二尾数子段、对应二次函数系数以及定点数乘加运算,得出二次多项式的值;后处理输出单元,用于将二次多项式的值进行归一化,并结合浮点数的符号位和阶码,以输出浮点数格式的值,解决激活函数计算速度较慢的问题。
-
公开(公告)号:CN119089099A
公开(公告)日:2024-12-06
申请号:CN202411233902.X
申请日:2024-09-04
Applicant: 南京大学
IPC: G06F17/15 , G06F7/485 , G06F7/487 , G06N3/0464
Abstract: 本申请提供一种高精度双曲正切函数计算装置,计算装置包括参数获取模块,参数获取模块被配置为从卷积神经网络中获取单精度浮点参数;参数判断模块,参数判断单元被配置为判断单精度浮点参数的绝对值与预设值之间的关系,并生成对应的计算指令;计算执行模块,计算执行模块被配置为根据计算指令对单精度浮点参数进行双曲正切函数的计算,得到目标输出,目标输出用于表征卷积神经网络中的非线性特征;双曲正切函数的计算包括泰勒展开式计算、直接输出计算以及定义式计算,定义式计算包括将超越函数利用快速插值算法进行计算。本申请通过上述计算装置解决了现有激活函数计算方案计算复杂度高且计算结果不精确的问题。
-
-
-
-