-
公开(公告)号:CN106250097A
公开(公告)日:2016-12-21
申请号:CN201610460936.1
申请日:2016-06-22
Applicant: 中国科学院计算技术研究所 , 无锡江南计算技术研究所
IPC: G06F7/24
CPC classification number: G06F7/24
Abstract: 本发明提出一种面向大数据的加速排序装置、方法、芯片、处理器,涉及处理器设计领域,该方法对待排序列数据,每次取连续n位数据,取m组,并存放在所述寄存器组中;分别对m组所述待排序列数据进行排序,生成m组有序序列数据,通过排序算法将所述有序序列数据进行排序。本发明将所有与比较相关的排序算法复杂度降为原来的1/n;同时,这种n单元数据的连续访存,一定程度降低了访存开销,从而大大的提高了排序算法的执行速度,通过本发明,提高了单个节点处理器上针对排序应用的处理效率。
-
公开(公告)号:CN106126440A
公开(公告)日:2016-11-16
申请号:CN201610459904.X
申请日:2016-06-22
Applicant: 中国科学院计算技术研究所 , 无锡江南计算技术研究所
IPC: G06F12/0811 , G06F12/0897
CPC classification number: G06F12/0811 , G06F12/0897
Abstract: 本发明提出一种改善数据在缓存中空间局部性的缓存方法及装置,涉及高速缓存技术领域,该方法包括设置主缓存与辅缓存,当进行访存操作时,先访问所述主缓存,从访存地址中解析出索引域,根据所述索引域定位所述主缓存中的组相联缓存块;检查所述组相联缓存块的有效位,判断是否命中,若命中,则从命中的缓存块中获取欲访问的数据,否则访问辅缓存,判断是否命中,若命中,从所述辅缓存中获取所述欲访问的数据;若所述辅缓存未命中,则从内存中获取所述欲访问的数据,并将所述欲访问的数据所在的数据块复制到所述主缓存中,将内存中与所述欲访问的数据空间局部性关系最好的数据块复制到所述辅缓存中。
-
公开(公告)号:CN106126434B
公开(公告)日:2019-04-30
申请号:CN201610460009.X
申请日:2016-06-22
Applicant: 中国科学院计算技术研究所 , 无锡江南计算技术研究所
IPC: G06F12/02 , G06F12/0893
Abstract: 本发明适用于计算机技术领域,提供了一种中央处理器缓存区的缓存行的替换方法及装置,所述方法包括:步骤1,根据分别缓存在所述中央处理器缓存区的多个缓存行中的多个应用程序的任务的优先级标识值和被访问的时间间隔,计算所述中央处理器缓存区中需要被替换的缓存行;步骤2,将所述中央处理器缓存区中需要被替换的缓存行进行替换。借此,本发明提高了实时性数据块的命中率。
-
公开(公告)号:CN106453072A
公开(公告)日:2017-02-22
申请号:CN201610460938.0
申请日:2016-06-22
Applicant: 中国科学院计算技术研究所 , 无锡江南计算技术研究所
IPC: H04L12/701 , H04L12/771
Abstract: 本发明提供了一种片上网络路由器通道资源的贪婪分配方法,适用于片上网络技术领域,所述贪婪分配方法在交叉开关分配阶段为路由器的内部的输入端口与输出端口进行映射之前进行,包括:预处理步骤,当数据包进入所述输入端口的子通道和虚通道中时,将数据包信息进行归类处理得到预处理信息表;执行步骤,根据所述预处理信息表以及所述数据包对应的所述输出端口的大小,选择最大限度多个所述数据包匹配所述子通道和所述输出端口。同时还提供一种片上网络路由器通道资源的贪婪分配装置。借此,本发明利用贪婪算法思想对输入端口和输出端口之间进行通道的匹配,达到趋向于最优的映射,提高通道的利用率。
-
公开(公告)号:CN106168940A
公开(公告)日:2016-11-30
申请号:CN201610460013.6
申请日:2016-06-22
Applicant: 中国科学院计算技术研究所 , 无锡江南计算技术研究所
IPC: G06F15/173 , H04L12/771
CPC classification number: G06F15/17318 , G06F15/17312 , H04L45/60
Abstract: 本发明提供了一种高密度片上网络的路网实现方法,适用于众核片上网络技术领域,包括:步骤1,将第一路由和第二路由的链路划分为多个低宽度的自治的子链路;步骤2,检测输入端口的数据包的队列,配置所述子链路和所述队列在同一时刻并行传输最大数量的所述数据包;步骤3,根据所述数据包并行传输前的路由信息,将所述数据包进行拆分输出。同时本发明还提供一种高密度片上网络的路网路由装置。借此,本发明实现了片上网络细粒度数据传输的结构及路由机制的优化。
-
公开(公告)号:CN106126440B
公开(公告)日:2019-01-25
申请号:CN201610459904.X
申请日:2016-06-22
Applicant: 中国科学院计算技术研究所 , 无锡江南计算技术研究所
IPC: G06F12/0811 , G06F12/0897
-
公开(公告)号:CN106126434A
公开(公告)日:2016-11-16
申请号:CN201610460009.X
申请日:2016-06-22
Applicant: 中国科学院计算技术研究所 , 无锡江南计算技术研究所
IPC: G06F12/02 , G06F12/0893
CPC classification number: G06F12/0269 , G06F12/0893
Abstract: 本发明适用于计算机技术领域,提供了一种中央处理器缓存区的缓存行的替换方法及装置,所述方法包括:步骤1,根据分别缓存在所述中央处理器缓存区的多个缓存行中的多个应用程序的任务的优先级标识值和被访问的时间间隔,计算所述中央处理器缓存区中需要被替换的缓存行;步骤2,将所述中央处理器缓存区中需要被替换的缓存行进行替换。借此,本发明提高了实时性数据块的命中率。
-
公开(公告)号:CN102932276B
公开(公告)日:2015-01-14
申请号:CN201210379911.0
申请日:2012-10-09
Applicant: 无锡江南计算技术研究所
IPC: H04L12/861 , H04L12/803
Abstract: 本发明提供的一种计算节点集群系统和数据中继器。计算节点集群系统包括:多个计算节点,其中每个计算节点包括各自的FPGA和通用处理器;其中,各个计算节点的通用处理器通过网络相互连接;并且,在每个计算节点中,FPGA连接至通用处理器;其中,每个FPGA均具有数据中继器;而且,所有计算节点的FPGA通过数据中继器依次连接。在一个连续发送过程中,动态自适应通路选择器先转发来自当前计算节点的通用处理器的所有消息,然后转发来自其他FPGA的所有消息。并且,动态自适应通路选择器在每个连续发送过程完成之后动态地调整在下一次连续发送过程发送的来自通用处理器的数据量与来自其他FPGA的数据量之间的比例。
-
公开(公告)号:CN102761578B
公开(公告)日:2015-01-14
申请号:CN201110110793.9
申请日:2011-04-29
Applicant: 无锡江南计算技术研究所
IPC: H04L29/08
Abstract: 本发明提供了一种集群计算系统,包括通过网络互连的计算节点集群,所述计算节点包括嵌入式处理器、嵌入式DRAM、非易失性存储器阵列,还包括扩展计算部件以及电源管理模块;所述嵌入式处理器提供整数计算能力;所述扩展计算部件与嵌入式处理器相集成,并根据计算应用领域定制专项计算能力,辅助嵌入式处理器进行数据处理;所述嵌入式DRAM通过处理器直连接口与嵌入式处理器连接,作为处理器缓存;所述非易失性存储器阵列用于永久性存储数据;所述电源管理模块用于对计算节点供电,并根据嵌入式处理器的负载情况调整对嵌入式处理器的供电功率。本发明集群计算系统具有较低的功耗以及较强的计算能力。
-
公开(公告)号:CN102761473A
公开(公告)日:2012-10-31
申请号:CN201110110822.1
申请日:2011-04-29
Applicant: 无锡江南计算技术研究所
Abstract: 一种建立部件模型间通信的模拟方法,包括:将所述部件模型以矩阵形式分布,确定所述矩阵的维数;根据所述部件模型的类型,将所述矩阵分成子矩阵,基于所述矩阵的维数及所述子矩阵在所述矩阵中的位置生成分布表达式;基于所述部件模型在所述矩阵中的位置坐标和待模拟的部件模型间的连接关系生成连接关系表达式;检查所述分布表达式和连接关系表达式的逻辑是否正确,若正确则基于所述连接关系表达式,生成并行事务级模拟系统的描述文件。本发明公开的技术方案提高了并行事务级模拟系统的开发效率,降低了维护部件模型和并行事务级模拟系统的开销。
-
-
-
-
-
-
-
-
-