-
公开(公告)号:CN112686287A
公开(公告)日:2021-04-20
申请号:CN202011526821.0
申请日:2020-12-22
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于非因果时间卷积神经网络的加密流量分类方法,包括以下步骤:对网络流量进行预处理,形成以会话为单位切分的流量数据;构建基于非因果时间卷积神经网络的分类模型:所述基于非因果时间卷积神经网络的分类模型包括若干个非因果卷积残差块、全连接层和用于输出分类结果的Softmax分类器层;所述非因果卷积残差块由两层空洞卷积构成;在每个空洞卷积层后连接权重归一化层和激活层,并使用ReLU函数作为激活函数;在跨越连接中,使用1*1卷积;最后,将若干残差块堆叠组合后连接全连接层和分类层。本发明扩大了卷积核的作用域和特征点的感受野,可确保全局信息不被遗漏,能够显著提升分类效果。
-
公开(公告)号:CN112632461A
公开(公告)日:2021-04-09
申请号:CN202011524214.0
申请日:2020-12-22
Applicant: 无锡江南计算技术研究所
IPC: G06F17/16
Abstract: 本发明公开一种定制阵列计算结构上复杂线性代数运算的实现方法,包括以下步骤:步骤1:根据线性代数运算的类型,对输入矩阵A,B,C进行分块,分块粒度为nb;步骤2:将输入矩阵分解为多个小规模矩阵和剩余矩阵;步骤3:在定制阵列计算结构上完成小规模矩阵的线性代数运算;步骤4:在定制阵列计算结构上完成矩阵乘运算;步骤5:根据小规模矩阵上线性代数运算的计算结果和矩阵乘运算的计算结果更新剩余矩阵;步骤6:若剩余矩阵的规模大于等于nb,则将剩余矩阵作为输入矩阵,返回步骤1执行,否则运算完成。本发明可实现基本线性代数子程序库中所定义的level‑3运算或复杂线性代数运算在定制计算结构上的高性能、高效执行。
-
公开(公告)号:CN112632459A
公开(公告)日:2021-04-09
申请号:CN202011525795.X
申请日:2020-12-22
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种深度卷积的在线计算部件,包括标准卷积部件、累加器和连接于累加器数据输出接口上的深度卷积部件;所述深度卷积部件包括若干级激活值站台、若干个乘法器、若干个权重值站台和至少一个设置于2个相邻激活值站台之间的延迟站台,每一个乘法器配备1个激活值站台和1个权重值站台,延迟站台的延迟值D等于输入激活图的宽度,权重值在卷积计算开始之前预先置位,激活值站台采用逐级推进的方式注入运算部件,每一级激活值站台中当前存放的结果送到下一级激活值站台。本发明在不破坏累加器输出数据结构的前提下,高效地完成了深度卷积计算,可以很大程度提高深度卷积运算的计算资源利用率,加速整个神经网络的运算速度。
-
公开(公告)号:CN112508125A
公开(公告)日:2021-03-16
申请号:CN202011529800.4
申请日:2020-12-22
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种目标检测模型的高效全整数量化方法,所述图像检测模型中各层卷积的权值、偏置、输入特征图和输出特征图均采用整数表示,量化推理过程均采用整数计算,具体包括以下步骤:对实数版本的图像检测模型进行正常训练、量化感知训练、量化参数生成、应用生成的各层参数,在计算设备上进行基于全整数运算的推理。本发明可以大大减少图像检测模型的推理时间,减少模型在磁盘存储和内存占用方面的空间,同时保持图像检测模型的高检测精度,有助于在FPGA等计算设备上实现更加高效的图像目标检测系统。
-
公开(公告)号:CN112631548B
公开(公告)日:2022-10-04
申请号:CN202011524239.0
申请日:2020-12-22
Applicant: 无锡江南计算技术研究所
IPC: G06F7/523
Abstract: 本发明公开一种基于混合粒度乘法部件的多精度乘法器及运算方法,所述运算方法包括以下步骤:调度器将乘法运算的两个位宽分别为Mbit、Nbit的操作数进行分割;调度器计算步骤1中获得的每一组细粒度乘法运算结果需要向左移动的位数;调度器将步骤1中分割后的细粒度乘法运算的两个操作数和步骤2中对应的左移位数打包成乘法器指令;调度器将步骤3中生成的乘法器指令送入计算单元的指令队列;细粒度乘法部件完成细粒度的乘法运算;将乘法结果向左移位后的结果送入加法树。本发明很好的平衡了计算延迟、计算能力的利用率和控制结构复杂度三者之间的关系,降低了控制结构的复杂度。
-
公开(公告)号:CN112631801B
公开(公告)日:2022-10-04
申请号:CN202011530140.1
申请日:2020-12-22
Applicant: 无锡江南计算技术研究所
IPC: G06F9/54 , G06F9/38 , G06F9/50 , G06F16/182 , G06T1/20
Abstract: 本发明公开一种遥感影像智能模型分布式并行方法,包括以下步骤:从业务应用系统中接入遥感影像的文件系统地址和模型选取字段;通过图像预处理库读取遥感影像;大图的元数据信息和切片的元数据信息通过JSON序列化,并采用PUSH机制将大图的元数据信息与切片的元数据信息压入内存消息队列中;采用异步多线程竞争机制和阻塞访问的访问规则访问内存消息队列;检测结果的元数据信息通过JSON序列化并PUSH到内存消息队列中;识别结果的元数据信息通过JSON序列化并PUSH到内存消息队列中;最终检测识别的元数据信息封装成统一查询接口。本发明可有效满足海量遥感影像大吞吐量、准实时计算和敏捷模型并行部署的需求。
-
公开(公告)号:CN112632459B
公开(公告)日:2023-07-07
申请号:CN202011525795.X
申请日:2020-12-22
Applicant: 无锡江南计算技术研究所
IPC: G06F17/15 , G06N3/0464 , G06F17/16
Abstract: 本发明公开一种深度卷积的在线计算部件,包括标准卷积部件、累加器和连接于累加器数据输出接口上的深度卷积部件;所述深度卷积部件包括若干级激活值站台、若干个乘法器、若干个权重值站台和至少一个设置于2个相邻激活值站台之间的延迟站台,每一个乘法器配备1个激活值站台和1个权重值站台,延迟站台的延迟值D等于输入激活图的宽度,权重值在卷积计算开始之前预先置位,激活值站台采用逐级推进的方式注入运算部件,每一级激活值站台中当前存放的结果送到下一级激活值站台。本发明在不破坏累加器输出数据结构的前提下,高效地完成了深度卷积计算,可以很大程度提高深度卷积运算的计算资源利用率,加速整个神经网络的运算速度。
-
公开(公告)号:CN112631801A
公开(公告)日:2021-04-09
申请号:CN202011530140.1
申请日:2020-12-22
Applicant: 无锡江南计算技术研究所
IPC: G06F9/54 , G06F9/38 , G06F9/50 , G06F16/182 , G06T1/20
Abstract: 本发明公开一种遥感影像智能模型分布式并行方法,包括以下步骤:从业务应用系统中接入遥感影像的文件系统地址和模型选取字段;通过图像预处理库读取遥感影像;大图的元数据信息和切片的元数据信息通过JSON序列化,并采用PUSH机制将大图的元数据信息与切片的元数据信息压入内存消息队列中;采用异步多线程竞争机制和阻塞访问的访问规则访问内存消息队列;检测结果的元数据信息通过JSON序列化并PUSH到内存消息队列中;识别结果的元数据信息通过JSON序列化并PUSH到内存消息队列中;最终检测识别的元数据信息封装成统一查询接口。本发明可有效满足海量遥感影像大吞吐量、准实时计算和敏捷模型并行部署的需求。
-
公开(公告)号:CN112631548A
公开(公告)日:2021-04-09
申请号:CN202011524239.0
申请日:2020-12-22
Applicant: 无锡江南计算技术研究所
IPC: G06F7/523
Abstract: 本发明公开一种基于混合粒度乘法部件的多精度乘法器及运算方法,所述运算方法包括以下步骤:调度器将乘法运算的两个位宽分别为Mbit、Nbit的操作数进行分割;调度器计算步骤1中获得的每一组细粒度乘法运算结果需要向左移动的位数;调度器将步骤1中分割后的细粒度乘法运算的两个操作数和步骤2中对应的左移位数打包成乘法器指令;调度器将步骤3中生成的乘法器指令送入计算单元的指令队列;细粒度乘法部件完成细粒度的乘法运算;将乘法结果向左移位后的结果送入加法树。本发明很好的平衡了计算延迟、计算能力的利用率和控制结构复杂度三者之间的关系,降低了控制结构的复杂度。
-
-
-
-
-
-
-
-