-
公开(公告)号:CN119967140A
公开(公告)日:2025-05-09
申请号:CN202510134829.9
申请日:2025-02-07
Applicant: 南京大学
IPC: H04N9/31
Abstract: 本申请提供一种投影图像实时矫正方法及系统,所述方法包括:获取投影设备的第一姿态数据;确定投影平面的第二姿态数据;基于第一姿态数据和第二姿态数据,得到变换矩阵;根据投影信息,计算透视投影矩阵;投影信息包括:投影设备的视野角度、近裁剪面距离、远裁剪面距离,投影图像的纵横比;确定待投影图像的实时基准坐标点;基于变换矩阵、透视投影矩阵、实时基准坐标点,计算矫正坐标点;矫正坐标点围设有目标成像区域;将待投影图像调整至目标成像区域内,以使待投影图像投射至投影平面,以解决目前的投影设备无法实时对投影画面进行矫正,导致投影画面矫正过程具有较高的延迟,投影画面出现不连续,影响用户观感的问题。
-
公开(公告)号:CN119249050A
公开(公告)日:2025-01-03
申请号:CN202411309098.9
申请日:2024-09-19
Applicant: 南京大学
Abstract: 本申请提供一种基于系数查找表的非线性激活函数快速计算装置及方法,装置包括:输入选择单元,用于选择输入的浮点数;系数查找表单元,用于将激活函数全区域划分为若干区间,并将非无限区间划分成若干段;在每一段上使用二次函数进行逼近,以建立系数查找表;预处理单元,用于对浮点数进行特征提取,以得到符号位、阶码和尾数;运算单元,用于计算出索引值和第二尾数子段;根据索引值在系数查找表中获取对应二次函数系数;基于第二尾数子段、对应二次函数系数以及定点数乘加运算,得出二次多项式的值;后处理输出单元,用于将二次多项式的值进行归一化,并结合浮点数的符号位和阶码,以输出浮点数格式的值,解决激活函数计算速度较慢的问题。
-
公开(公告)号:CN119204127A
公开(公告)日:2024-12-27
申请号:CN202411335028.0
申请日:2024-09-24
Applicant: 南京大学
IPC: G06N3/063 , G06N3/0464 , G06T1/40 , G06T1/60
Abstract: 本申请提供一种面向权重的稀疏卷积加速器硬件装置,包括:部分和生成模块,被配置为:获取特征图上预设数量激活点的特征,并生成特征矩阵;将特征矩阵和权重矩阵相乘,得到激活点对应的部分和;读写控制模块,被配置为:发送激活点坐标至激活点坐标生成模块,发送部分和至部分和求和模块;激活点坐标生成模块,被配置为:根据激活点坐标的纵坐标,生成激活点坐标集;部分和求和模块,被配置为:对部分和进行求和,得到输出特征;计算模块,被配置为:基于激活点坐标集、输出特征,获取特征图的目标特征,以解决目前的稀疏卷积加速器利用规则表对特征图进行计算时,当输入特征图变化时规则表也需重新生成,导致降低了计算效率的问题。
-
公开(公告)号:CN119089099A
公开(公告)日:2024-12-06
申请号:CN202411233902.X
申请日:2024-09-04
Applicant: 南京大学
IPC: G06F17/15 , G06F7/485 , G06F7/487 , G06N3/0464
Abstract: 本申请提供一种高精度双曲正切函数计算装置,计算装置包括参数获取模块,参数获取模块被配置为从卷积神经网络中获取单精度浮点参数;参数判断模块,参数判断单元被配置为判断单精度浮点参数的绝对值与预设值之间的关系,并生成对应的计算指令;计算执行模块,计算执行模块被配置为根据计算指令对单精度浮点参数进行双曲正切函数的计算,得到目标输出,目标输出用于表征卷积神经网络中的非线性特征;双曲正切函数的计算包括泰勒展开式计算、直接输出计算以及定义式计算,定义式计算包括将超越函数利用快速插值算法进行计算。本申请通过上述计算装置解决了现有激活函数计算方案计算复杂度高且计算结果不精确的问题。
-
公开(公告)号:CN112906874B
公开(公告)日:2024-08-23
申请号:CN202110367961.6
申请日:2021-04-06
Applicant: 南京大学
Abstract: 本申请公开了卷积神经网络特征图数据压缩方法及装置,该方法包括特征图通道重构阶段和零值比特图编码压缩阶段;特征图通道重构阶段中,使用一维离散余弦变换对特征图通道维进行重构,利用频域过滤器实现高频信息过滤,得到稀疏度高于原特征图的稀疏特征图,然后在零值比特图编码压缩阶段对稀疏特征图进行压缩,得到所述原特征图的最终压缩数据。上述方法利用卷积神经网络的通道冗余,实现将有一定频域特征的通道组重构到一起,提升待传输数据的稀疏度,进而提升了被压缩的潜力,随后使用零值比特图编码压缩对稀疏特征图压缩,提高了压缩率。
-
公开(公告)号:CN113379034B
公开(公告)日:2023-10-20
申请号:CN202110661438.4
申请日:2021-06-15
Applicant: 南京大学
IPC: G06N3/0464 , G06N3/063 , G06N3/082
Abstract: 本申请公开了一种基于网络结构搜索技术的神经网络结构优化方法,包括以下步骤:获取训练样本,将所述训练样本输入初始神经网络,通过搜索算法根据所述训练样本,在所述初始神经网络上依次生成具有不同搜索状态的分支神经网络结构,得到若干个待优化神经网络结构,所述搜索状态包括插入分支的节点位置和对应节点位置的插入深度,对待优化神经网络结构进行优化,得到最优神经网络结构。通过搜索算法自动在初始神经网络结构上构建分支神经网络结构,对其进行优化后,得到最优神经网络分支结构,解决了现有神经网络构建过程中,通过动态计算的模型压缩算法对模型进行压缩,耗费大量人力物力,同时还存在神经网络陷入局部最优,严重影响效率的问题。
-
公开(公告)号:CN112131529B
公开(公告)日:2023-10-13
申请号:CN202010999435.7
申请日:2020-09-22
Applicant: 南京大学
Abstract: 本申请公开一种基于E‑G两步法的配对交易协整关系加速验证方法,包括:获取待验证协整关系的两个时间序列;对其残差及所述残差的差分进行增广迪基福勒检验,其中:利用LDLT分解法求解最大滞后阶数对应的回归分析结果;根据所述最大滞后阶数对应的回归分析结果,获取全部滞后阶数对应的回归分析结果,得到对应的误差平方和;利用优化的赤池信息量准则公式,计算所述全部滞后阶数对应的赤池信息量准则函数值;选取最小的所述赤池信息量准则函数值对应的滞后阶数为最优滞后阶数;得到所述最优滞后阶数对应的回归系数。本申请针对传统算法中的多次应用普通最小二乘法算法进行算法强度缩减和近似计算,提高两个时间序列协整关系的验证速度。
-
公开(公告)号:CN111313905B
公开(公告)日:2023-10-13
申请号:CN202010111088.X
申请日:2020-02-24
Applicant: 南京大学
IPC: H03M7/24
Abstract: 本发明公开了一种浮点数转换方法及装置,能够将基于IEEE 754规范的单精度浮点数转换为posit数据格式的浮点数,即第二浮点数。在很多神经网络的训练过程中,其运算数据近似服从正态分布,可通过变换使数据集中在0附近,而本发明中的posit数据格式的浮点数在神经网络训练过程中就可以在0附近保证精度,并且,本发明中posit数据格式的浮点数的预设总位宽是可以调控的,因此又可以很大程度的减少数据位宽,进而减少存储所需要的资源以及读写过程所消耗的资源,提高神经网络训练的效率。
-
公开(公告)号:CN116521765A
公开(公告)日:2023-08-01
申请号:CN202310122964.2
申请日:2023-02-15
Applicant: 南京大学
IPC: G06F16/248 , G06F16/22 , G06F16/242 , G06F16/2455 , G06F16/2458 , G06F16/35 , G06N3/02 , G06Q40/04
Abstract: 本申请提供一种基于新闻文本的预测信息显示系统及方法,包括:处理模块、神经网络模块、拐点运算模块以及显示模块;所述处理模块获取历史新闻文本;再通过所述神经网络模块调用已建立好的神经网络模型,以使所述神经网络模型提取所述历史新闻文本的事件信息、目标特征信息以及分类信息;根据所述事件信息、目标特征信息以及分类信息,通过所述拐点运算模块生成带有拐点标签的预测特征序列;基于所述预测特征序列与所述事件信息、目标特征信息以及分类信息建立可视化图表;根据所述可视化图表生成事件查找表,以及控制所述显示模块显示基于所述事件查找表渲染的查询界面以解决利用人工智能技术来分析新闻文本时预测结果显示异常的问题。
-
公开(公告)号:CN116167419A
公开(公告)日:2023-05-26
申请号:CN202111386001.0
申请日:2021-11-22
Applicant: 南京大学
Abstract: 本申请涉及人工智能算法硬件加速技术领域,提供一种兼容N:M稀疏的Transformer加速器的架构及加速方法,Transformer加速器的架构包括控制单元、储存单元和计算单元;计算单元包括多模兼容矩阵乘法计算模块、矢量计算模块、重排模块、Softmax计算模块。在实际应用中,多模兼容矩阵乘法计算模块负责Transformer模型中运算量密集的矩阵乘法的计算,根据控制信号动态配置,执行两个稠密矩阵的矩阵乘法计算,或者执行单个N:M结构化稀疏矩阵与单个稠密矩阵的矩阵乘法计算;Softmax计算模块负责计算Transformer模型中的Softmax算子,矢量计算模块用于累加多模兼容矩阵乘法计算模块的运算结果,并将累加的运算结果发送至重排模块;重排模块用于对累加的运算结果进行重排,并存储至中间数据存储器或激活存储器。
-
-
-
-
-
-
-
-
-