-
公开(公告)号:CN102929329A
公开(公告)日:2013-02-13
申请号:CN201210376655.X
申请日:2012-09-28
Applicant: 无锡江南计算技术研究所
Abstract: 一种片上系统间互连网络的动态重构方法包括:将片上系统的网络接口控制模块连接至网络,网络接口控制模块包括控制寄存器组、状态寄存器组、数据寄存器组、接口控制逻辑、以及一组接口信号管脚;利用控制寄存器组的一个命令寄存器和一个缓存寄存器来分别保存下一次操作的操作命令和相关数据;利用状态寄存器组保存接口控制模块的各种当前状态;利用数据寄存器组的一组寄存器来缓存接口数据,其中寄存器中的每一比特位对应接口信号管脚的当前值;利用接口控制逻辑控制管脚工作模式的配置、数据的发送/接收过程。本发明通过动态重配置网络接口的工作模式,可以动态改变互连网络的拓扑结构、链路连接方式,支持不同的通信模式。
-
公开(公告)号:CN102902656A
公开(公告)日:2013-01-30
申请号:CN201210370445.X
申请日:2012-09-28
Applicant: 无锡江南计算技术研究所
IPC: G06F15/78
Abstract: 本发明提供了一种可重构集群的模块化三维构造方法和可重构集群构造结构。将可重构集群所涉及的通用处理器节点、可重构加速器、集群互连网络三大主要部分进行模块化划分,从而形成通用处理器节点模块、可重构加速器基板和互连网络支撑底板三个相互支撑的功能模块;第二步骤,用于定义所述通用处理器节点模块、所述可重构加速器基板和所述互连网络支撑底板之间的功能接口;第三步骤,用于通过接插件实现所述通用处理器节点模块和所述可重构加速器基板的水平堆叠,形成一个可重构计算节点;第四步骤,用于将所述可重构计算节点以垂直插装的方式插装在具有网络交换能力的所述互连网络支撑底板上,从而形成一个基于三维构造的可重构集群结构。
-
公开(公告)号:CN102761578A
公开(公告)日:2012-10-31
申请号:CN201110110793.9
申请日:2011-04-29
Applicant: 无锡江南计算技术研究所
IPC: H04L29/08
Abstract: 本发明提供了一种集群计算系统,包括通过网络互连的计算节点集群,所述计算节点包括嵌入式处理器、嵌入式DRAM、非易失性存储器阵列,还包括扩展计算部件以及电源管理模块;所述嵌入式处理器提供整数计算能力;所述扩展计算部件与嵌入式处理器相集成,并根据计算应用领域定制专项计算能力,辅助嵌入式处理器进行数据处理;所述嵌入式DRAM通过处理器直连接口与嵌入式处理器连接,作为处理器缓存;所述非易失性存储器阵列用于永久性存储数据;所述电源管理模块用于对计算节点供电,并根据嵌入式处理器的负载情况调整对嵌入式处理器的供电功率。本发明集群计算系统具有较低的功耗以及较强的计算能力。
-
公开(公告)号:CN102760176A
公开(公告)日:2012-10-31
申请号:CN201110110834.4
申请日:2011-04-29
Applicant: 无锡江南计算技术研究所
IPC: G06F17/50
Abstract: 本发明提供了一种硬件事务级仿真方法、引擎及系统,所述方法包括:加载目标系统模型,根据所述目标系统模型创建至少一个仿真线程;依次执行所述仿真线程,将执行仿真线程产生的仿真事件加入事件队列,所述仿真事件记录待触发的仿真线程的线程号;调取所述事件队列中的仿真事件,调度并执行调取的仿真事件记录的待触发的仿真线程的线程号指向的仿真线程,将执行仿真线程产生的仿真事件加入所述事件队列。本发明基于事件驱动的仿真机制,加快了仿真速度,同时提供了精简的仿真建模接口能更方便地描述具有普遍并发性的硬件系统。
-
公开(公告)号:CN102446087A
公开(公告)日:2012-05-09
申请号:CN201010508876.9
申请日:2010-10-12
Applicant: 无锡江南计算技术研究所
IPC: G06F9/38
Abstract: 一种指令预取方法与预取装置。所述指令预取装置,用于向处理器核心提供指令预取服务,包括:取指控制单元,用于接收处理器核心提供的预取请求,基于所述预取请求在指令缓存单元搜索与所述预取请求对应的指令,或指示指令缓存单元从片外主存中获取与所述预取请求对应的指令;基于所述预取请求指示指令缓存单元将与预取请求对应的指令提供给处理器核心;指令缓存单元,用于存储指令;响应所述取指控制单元的指示,从片外主存中获取与所述预取请求对应的指令,以及将与预取请求对应的指令提供给处理器核心。本发明的指令预取方法与预取装置以较为简便的方式实现了多核处理器的指令预取,简化了硬件指令存储的管理逻辑,提高了处理器的处理效率。
-
公开(公告)号:CN112671757B
公开(公告)日:2023-10-31
申请号:CN202011526966.0
申请日:2020-12-22
Applicant: 无锡江南计算技术研究所
IPC: H04L9/40 , H04L41/142 , H04L43/18 , G06F18/24 , G06N3/084 , G06N3/0985 , G06N3/0464 , G06N3/047 , G06N3/048
Abstract: 本发明公开一种基于自动机器学习的加密流量协议识别方法及装置,所述方法包括以下步骤:对加密流量进行会话切分、匿名化处理、统一数据包长度等数据预处理工作;提取流量样本的14个流特征;采用自动机器学习方法识别加密流量协议,并输出结果。本发明提供两种协议识别的方法,一种通过提取数据的统计特征自动生成最优的机器学习算法、模型并自动优化模型的超参数;另一种仅利用原始加密流量即可自动搜索出适合加密流量分类任务的最优神经网络结构,两种方法均可在无需借助人工智能专家智慧的情况下,自动生成优化的机器学习算法与神经网络模型,并自动优化超参数,实现对加密流量协议的自动分类,从而大大提升加密流量协议识别的准确率和效率。
-
公开(公告)号:CN115641282A
公开(公告)日:2023-01-24
申请号:CN202211363441.9
申请日:2022-11-02
Applicant: 无锡江南计算技术研究所
Abstract: 本申请公开了一种面向合成孔径雷达图像的目标检测方法及装置,方法包括确定至少两种卷积操作,并基于至少两种卷积操作构建第一神经网络;将样本合成孔径雷达图像输入至第一神经网络,并根据预测结果以及样本真实结果,计算出第一损失值;基于第一损失值进行训练,并根据第一神经网络中的架构参数以及预设派生规则,派生出第二神经网络;将待处理合成孔径雷达图像输入至第二神经网络,并根据预测结果在待处理合成孔径雷达图像上显示目标检测框。相比于人工设计目标检测的神经网络模型,通过神经架构搜索自动化完成更符合需求的网络设计,不仅有效避免过多的专家人工知识所带来的领域知识限制,还可极大提高目标的检测效率以及精度。
-
公开(公告)号:CN112631968B
公开(公告)日:2022-10-04
申请号:CN202011524240.3
申请日:2020-12-22
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种动态可演化智能处理芯片结构,包括:通用处理器、智能处理单元、内存控制器和内存接口、可编程逻辑区域、可编程逻辑控制器,所述可编程逻辑区域进一步包括:动态系统总线、动态IO控制器和动态智能计算单元;动态系统总线:可以根据需求,对其拓扑结构、接口数量和规格、仲裁机制等进行重构,动态IO控制器:用于根据系统对于IO需求的不同,重构为一个或者多个不同类型的IO控制器,动态智能计算单元:用于根据需要重构为特定的硬件结构,实现对计算、访存、IO的定制加速。本发明可实现对整个系统中计算、访存、IO等方面的性能和效率优化,提高智能应用的计算效率,实现智能应用的全栈定制加速。
-
公开(公告)号:CN112686287A
公开(公告)日:2021-04-20
申请号:CN202011526821.0
申请日:2020-12-22
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于非因果时间卷积神经网络的加密流量分类方法,包括以下步骤:对网络流量进行预处理,形成以会话为单位切分的流量数据;构建基于非因果时间卷积神经网络的分类模型:所述基于非因果时间卷积神经网络的分类模型包括若干个非因果卷积残差块、全连接层和用于输出分类结果的Softmax分类器层;所述非因果卷积残差块由两层空洞卷积构成;在每个空洞卷积层后连接权重归一化层和激活层,并使用ReLU函数作为激活函数;在跨越连接中,使用1*1卷积;最后,将若干残差块堆叠组合后连接全连接层和分类层。本发明扩大了卷积核的作用域和特征点的感受野,可确保全局信息不被遗漏,能够显著提升分类效果。
-
公开(公告)号:CN112632461A
公开(公告)日:2021-04-09
申请号:CN202011524214.0
申请日:2020-12-22
Applicant: 无锡江南计算技术研究所
IPC: G06F17/16
Abstract: 本发明公开一种定制阵列计算结构上复杂线性代数运算的实现方法,包括以下步骤:步骤1:根据线性代数运算的类型,对输入矩阵A,B,C进行分块,分块粒度为nb;步骤2:将输入矩阵分解为多个小规模矩阵和剩余矩阵;步骤3:在定制阵列计算结构上完成小规模矩阵的线性代数运算;步骤4:在定制阵列计算结构上完成矩阵乘运算;步骤5:根据小规模矩阵上线性代数运算的计算结果和矩阵乘运算的计算结果更新剩余矩阵;步骤6:若剩余矩阵的规模大于等于nb,则将剩余矩阵作为输入矩阵,返回步骤1执行,否则运算完成。本发明可实现基本线性代数子程序库中所定义的level‑3运算或复杂线性代数运算在定制计算结构上的高性能、高效执行。
-
-
-
-
-
-
-
-
-